DeepSeek R1 - cftime.io

阿里巴巴AI模型QwQ-32B 性能超越OpenAI 與DeepSeek R1看齊

Admin1 year ago1 year ago01 mins

阿里巴巴雲發布全新推理型AI模型QwQ-32B，以僅325億個參數，其性能卻與擁有6710億個參數的DeepSeek R1不相上下，甚至超越OpenAI的o1-mini，此舉震驚AI產業，挑戰了「規模越大，性能越好」的既有認知。這項突破顯示，巧妙的訓練技術在AI性能提升中，可能與模型規模同樣重要。即加入CFTime TG 討論區！想掌握最新加密市場動態與 AI 新聞與資訊，更能隨時獲得免費 web 3入場券！ QwQ-32B基於阿里巴巴的基礎模型開發 QwQ-32B基於阿里巴巴的Qwen 2.5-32B基礎模型開發，在內部基準測試中展現出令人矚目的表現：GPQA（研究生級科學推理測試）得分65.2%、AIME（高等數學）得分50%、MATH-500（涵蓋廣泛數學問題）得分高達90.6%。阿里巴巴Qwen團隊在其官方部落格中指出，此成果證明強化學習（RL）應用於基於豐富世界知識預訓練的強大基礎模型的有效性。團隊更強調，持續擴展強化學習能使中等規模模型與巨型MoE模型競爭。阿里巴巴在其官方推文中指出，QwQ-32B在數學推理和編碼任務中表現尤其出色。 Ollama和Groq也宣布已支援此模型，使用者可在第三方應用程式上使用，並透過Groq的基礎架構實現創紀錄的推理速度。然而，QwQ-32B也存在一些限制。例如，它在語言混合方面可能出現困難，並可能陷入影響效率的遞迴推理循環；此外，如同其他中國AI模型，它遵守當地法規，可能限制其對政治敏感話題的回應，且上下文窗口限制在32K tokens。儘管如此，QwQ-32B以Apache 2.0許可證開源釋出，與許多來自美國和西方國家、僅限付費使用的先進AI系統形成鮮明對比。此舉緊隨阿里巴巴一月發布Qwen 2.5-Max之後，當時阿里巴巴宣稱該模型幾乎全面超越競爭對手。這兩次發布都凸顯了中國科技公司在快速發展的AI領域所面臨的激烈競爭。特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」值得關注的是，美國總統特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」，但也視其為「機遇而非威脅」。 DeepSeek R1發布時曾引發股市大幅下跌，但QwQ-32B的發布並未造成類似影響，納斯達克綜合指數的下跌主要歸因於政治因素，而非對阿里巴巴影響力的恐懼、不確定性和懷疑（FUD）。阿里巴巴表示，QwQ-32B只是其在強化學習方面提升推理能力的初步步驟，相信結合更強大的基礎模型與規模化計算資源驅動的強化學習，將有助於更接近實現人工通用智能（AGI）的目標。此模型的出現，無疑將對全球AI產業格局帶來深遠的影響。

DeepSeek是什麼？中國以低廉成本匹敵OpenAI NVDA應聲暴跌（附試用連結）

Admin1 year ago1 year ago01 mins

中國AI研究團隊DeepSeek近日發布其全新研發的R1模型，在效能上與OpenAI最先進的推理系統不相伯仲，甚至在某些測試中表現更佳。更令人矚目的是，DeepSeek R1完全免費且開源，其訓練成本僅為OpenAI同級模型的2%，徹底顛覆了AI產業的既有格局。自一月底DeepSeek公佈後，NVDA股價明顯下跌，反之中國相關概念股，包括美圖（1357）、商湯等急升。即加入CFTime TG 討論區！想掌握最新加密市場動態與 AI 新聞與資訊，更能隨時獲得免費 web 3入場券！ DeepSeek是什麼？模型採用大規模強化學習訓練 DeepSeek-R1-Zero模型採用大規模強化學習（RL）訓練，並未經過傳統的監督式微調（SFT）。研究論文指出，此模型展現出卓越的推理能力，其學習方式更貼近人類的試錯學習過程。強化學習讓模型在不斷嘗試與回饋中自我提升，無需大量人工標註數據。傳統上，人工智能研究一直認為，持續的計算能力是釋放 AI 真正決策潛力的關鍵。這導致業界高度重視開發強大的硬件，通常成本高昂。然而，DeepSeek 通過展示替代方法同樣有效，徹底顛覆了這一觀點。 DeepSeek 的成功秘訣在於其創新的軟件架構和優化算法。通過利用現有硬件並開發能夠高效使用這些資源的軟件，DeepSeek 實現了與依賴大量計算資源的 AI 架構相媲美的性能。在AIME 2024數學基準測試中，DeepSeek R1取得79.8%的成功率，超越OpenAI的o1推理模型。在程式編碼測試平台Codeforces，其Elo評級達到2029，勝過96.3%的人類競爭者，展現出專家級水平。 DeepSeek R1的經濟效益更令人驚豔。其查詢成本僅為每百萬個token 0.14美元，相比OpenAI o1的7.50美元，足足降低了98%。 MIT許可證下的完全開源特性，讓全球開發者都能自由使用、修改和再分發此模型。業界反應：OpenAI模式受DeepSeek挑戰，開源AI時代來臨？ DeepSeek R1的釋出在AI業界掀起軒然大波，多位領袖人物紛紛發表評論，肯定其突破性意義。輝達首席研究員Jim Fan博士更指出，DeepSeek R1實現了OpenAI最初「開放研究，賦能所有人」的理想。他特別強調DeepSeek採用強化學習的成功，以及其透明地公開原始演算法和訓練曲線的做法，與業界常見的炒作宣傳形成強烈對比。蘋果研究員Awni Hannun更指出，DeepSeek R1的量化版本可在蘋果Mac上運行，顯示蘋果設備在AI運算能力上的提升。AI研究員Alex Cheema更成功利用8台Mac Mini組成集群，運行完整DeepSeek R1模型，成本仍遠低於運行其他頂尖AI模型所需的伺服器。 Stability AI創辦人Emad Mostaque則以挑釁的語氣指出，DeepSeek R1的出現，將對那些投入巨資卻無法超越其效能的AI實驗室造成巨大壓力。科技企業家Arnaud Bertrand更直言，DeepSeek R1的出現，如同以30美元的價格推出能與iPhone匹敵的手機，將嚴重衝擊OpenAI等商業AI模型的市場地位。 Perplexity AI執行長Arvind Srinivas則從市場角度分析，DeepSeek R1基本複製了OpenAI o1 mini的功能，並以開源方式釋出，顯示推理能力正在快速商品化。他更表示，Perplexity Pro未來將整合DeepSeek R1的推理能力。 DeepSeek超越OpenAI，更具人性化…