QwQ-32B

阿里巴巴AI模型QwQ-32B 性能超越OpenAI 與DeepSeek R1看齊

阿里巴巴雲發布全新推理型AI模型QwQ-32B,以僅325億個參數,其性能卻與擁有6710億個參數的DeepSeek R1不相上下,甚至超越OpenAI的o1-mini,此舉震驚AI產業,挑戰了「規模越大,性能越好」的既有認知。 這項突破顯示,巧妙的訓練技術在AI性能提升中,可能與模型規模同樣重要。 即加入CFTime TG 討論區!想掌握最新加密市場動態與 AI 新聞與資訊,更能隨時獲得免費 web 3入場券! QwQ-32B基於阿里巴巴的基礎模型開發 QwQ-32B基於阿里巴巴的Qwen 2.5-32B基礎模型開發,在內部基準測試中展現出令人矚目的表現:GPQA(研究生級科學推理測試)得分65.2%、AIME(高等數學)得分50%、MATH-500(涵蓋廣泛數學問題)得分高達90.6%。阿里巴巴Qwen團隊在其官方部落格中指出,此成果證明強化學習(RL)應用於基於豐富世界知識預訓練的強大基礎模型的有效性。 團隊更強調,持續擴展強化學習能使中等規模模型與巨型MoE模型競爭。 阿里巴巴在其官方推文中指出,QwQ-32B在數學推理和編碼任務中表現尤其出色。 Ollama和Groq也宣布已支援此模型,使用者可在第三方應用程式上使用,並透過Groq的基礎架構實現創紀錄的推理速度。 然而,QwQ-32B也存在一些限制。 例如,它在語言混合方面可能出現困難,並可能陷入影響效率的遞迴推理循環;此外,如同其他中國AI模型,它遵守當地法規,可能限制其對政治敏感話題的回應,且上下文窗口限制在32K tokens。 儘管如此,QwQ-32B以Apache 2.0許可證開源釋出,與許多來自美國和西方國家、僅限付費使用的先進AI系統形成鮮明對比。 此舉緊隨阿里巴巴一月發布Qwen 2.5-Max之後,當時阿里巴巴宣稱該模型幾乎全面超越競爭對手。 這兩次發布都凸顯了中國科技公司在快速發展的AI領域所面臨的激烈競爭。 特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」 值得關注的是,美國總統特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」,但也視其為「機遇而非威脅」。 DeepSeek R1發布時曾引發股市大幅下跌,但QwQ-32B的發布並未造成類似影響,納斯達克綜合指數的下跌主要歸因於政治因素,而非對阿里巴巴影響力的恐懼、不確定性和懷疑(FUD)。 阿里巴巴表示,QwQ-32B只是其在強化學習方面提升推理能力的初步步驟,相信結合更強大的基礎模型與規模化計算資源驅動的強化學習,將有助於更接近實現人工通用智能(AGI)的目標。 此模型的出現,無疑將對全球AI產業格局帶來深遠的影響。

Read More
DeepSeek是什麼

DeepSeek是什麼?中國以低廉成本匹敵OpenAI NVDA應聲暴跌(附試用連結)

中國AI研究團隊DeepSeek近日發布其全新研發的R1模型,在效能上與OpenAI最先進的推理系統不相伯仲,甚至在某些測試中表現更佳。更令人矚目的是,DeepSeek R1完全免費且開源,其訓練成本僅為OpenAI同級模型的2%,徹底顛覆了AI產業的既有格局。自一月底DeepSeek公佈後,NVDA股價明顯下跌,反之中國相關概念股,包括美圖(1357)、商湯等急升。 即加入CFTime TG 討論區!想掌握最新加密市場動態與 AI 新聞與資訊,更能隨時獲得免費 web 3入場券! DeepSeek是什麼?模型採用大規模強化學習訓練 DeepSeek-R1-Zero模型採用大規模強化學習(RL)訓練,並未經過傳統的監督式微調(SFT)。研究論文指出,此模型展現出卓越的推理能力,其學習方式更貼近人類的試錯學習過程。 強化學習讓模型在不斷嘗試與回饋中自我提升,無需大量人工標註數據。 傳統上,人工智能研究一直認為,持續的計算能力是釋放 AI 真正決策潛力的關鍵。這導致業界高度重視開發強大的硬件,通常成本高昂。然而,DeepSeek 通過展示替代方法同樣有效,徹底顛覆了這一觀點。 DeepSeek 的成功秘訣在於其創新的軟件架構和優化算法。通過利用現有硬件並開發能夠高效使用這些資源的軟件,DeepSeek 實現了與依賴大量計算資源的 AI 架構相媲美的性能。 在AIME 2024數學基準測試中,DeepSeek R1取得79.8%的成功率,超越OpenAI的o1推理模型。在程式編碼測試平台Codeforces,其Elo評級達到2029,勝過96.3%的人類競爭者,展現出專家級水平。 DeepSeek R1的經濟效益更令人驚豔。其查詢成本僅為每百萬個token 0.14美元,相比OpenAI o1的7.50美元,足足降低了98%。 MIT許可證下的完全開源特性,讓全球開發者都能自由使用、修改和再分發此模型。 業界反應:OpenAI模式受DeepSeek挑戰,開源AI時代來臨? DeepSeek R1的釋出在AI業界掀起軒然大波,多位領袖人物紛紛發表評論,肯定其突破性意義。輝達首席研究員Jim Fan博士更指出,DeepSeek R1實現了OpenAI最初「開放研究,賦能所有人」的理想。他特別強調DeepSeek採用強化學習的成功,以及其透明地公開原始演算法和訓練曲線的做法,與業界常見的炒作宣傳形成強烈對比。 蘋果研究員Awni Hannun更指出,DeepSeek R1的量化版本可在蘋果Mac上運行,顯示蘋果設備在AI運算能力上的提升。AI研究員Alex Cheema更成功利用8台Mac Mini組成集群,運行完整DeepSeek R1模型,成本仍遠低於運行其他頂尖AI模型所需的伺服器。 Stability AI創辦人Emad Mostaque則以挑釁的語氣指出,DeepSeek R1的出現,將對那些投入巨資卻無法超越其效能的AI實驗室造成巨大壓力。科技企業家Arnaud Bertrand更直言,DeepSeek R1的出現,如同以30美元的價格推出能與iPhone匹敵的手機,將嚴重衝擊OpenAI等商業AI模型的市場地位。 Perplexity AI執行長Arvind Srinivas則從市場角度分析,DeepSeek R1基本複製了OpenAI o1 mini的功能,並以開源方式釋出,顯示推理能力正在快速商品化。他更表示,Perplexity Pro未來將整合DeepSeek R1的推理能力。 DeepSeek超越OpenAI,更具人性化…

Read More