阿里巴巴雲發布全新推理型AI模型QwQ-32B,以僅325億個參數,其性能卻與擁有6710億個參數的DeepSeek R1不相上下,甚至超越OpenAI的o1-mini,此舉震驚AI產業,挑戰了「規模越大,性能越好」的既有認知。 這項突破顯示,巧妙的訓練技術在AI性能提升中,可能與模型規模同樣重要。
即加入CFTime TG 討論區!想掌握最新加密市場動態與 AI 新聞與資訊,更能隨時獲得免費 web 3入場券!
QwQ-32B基於阿里巴巴的基礎模型開發
QwQ-32B基於阿里巴巴的Qwen 2.5-32B基礎模型開發,在內部基準測試中展現出令人矚目的表現:GPQA(研究生級科學推理測試)得分65.2%、AIME(高等數學)得分50%、MATH-500(涵蓋廣泛數學問題)得分高達90.6%。阿里巴巴Qwen團隊在其官方部落格中指出,此成果證明強化學習(RL)應用於基於豐富世界知識預訓練的強大基礎模型的有效性。 團隊更強調,持續擴展強化學習能使中等規模模型與巨型MoE模型競爭。

阿里巴巴在其官方推文中指出,QwQ-32B在數學推理和編碼任務中表現尤其出色。 Ollama和Groq也宣布已支援此模型,使用者可在第三方應用程式上使用,並透過Groq的基礎架構實現創紀錄的推理速度。
然而,QwQ-32B也存在一些限制。 例如,它在語言混合方面可能出現困難,並可能陷入影響效率的遞迴推理循環;此外,如同其他中國AI模型,它遵守當地法規,可能限制其對政治敏感話題的回應,且上下文窗口限制在32K tokens。
儘管如此,QwQ-32B以Apache 2.0許可證開源釋出,與許多來自美國和西方國家、僅限付費使用的先進AI系統形成鮮明對比。 此舉緊隨阿里巴巴一月發布Qwen 2.5-Max之後,當時阿里巴巴宣稱該模型幾乎全面超越競爭對手。 這兩次發布都凸顯了中國科技公司在快速發展的AI領域所面臨的激烈競爭。
特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」
值得關注的是,美國總統特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」,但也視其為「機遇而非威脅」。 DeepSeek R1發布時曾引發股市大幅下跌,但QwQ-32B的發布並未造成類似影響,納斯達克綜合指數的下跌主要歸因於政治因素,而非對阿里巴巴影響力的恐懼、不確定性和懷疑(FUD)。
阿里巴巴表示,QwQ-32B只是其在強化學習方面提升推理能力的初步步驟,相信結合更強大的基礎模型與規模化計算資源驅動的強化學習,將有助於更接近實現人工通用智能(AGI)的目標。 此模型的出現,無疑將對全球AI產業格局帶來深遠的影響。