最新資訊

阿里巴巴AI模型QwQ-32B 性能超越OpenAI 與DeepSeek R1看齊

Admin1 year ago1 year ago01 mins

阿里巴巴雲發布全新推理型AI模型QwQ-32B，以僅325億個參數，其性能卻與擁有6710億個參數的DeepSeek R1不相上下，甚至超越OpenAI的o1-mini，此舉震驚AI產業，挑戰了「規模越大，性能越好」的既有認知。這項突破顯示，巧妙的訓練技術在AI性能提升中，可能與模型規模同樣重要。

即加入CFTime TG 討論區！想掌握最新加密市場動態與 AI 新聞與資訊，更能隨時獲得免費 web 3入場券！

QwQ-32B基於阿里巴巴的基礎模型開發

QwQ-32B基於阿里巴巴的Qwen 2.5-32B基礎模型開發，在內部基準測試中展現出令人矚目的表現：GPQA（研究生級科學推理測試）得分65.2%、AIME（高等數學）得分50%、MATH-500（涵蓋廣泛數學問題）得分高達90.6%。阿里巴巴Qwen團隊在其官方部落格中指出，此成果證明強化學習（RL）應用於基於豐富世界知識預訓練的強大基礎模型的有效性。團隊更強調，持續擴展強化學習能使中等規模模型與巨型MoE模型競爭。

阿里巴巴AI模型QwQ-32B 性能超越OpenAI 與DeepSeek R1看齊 — _{阿里巴巴AI模型QwQ-32B性能比較。}

阿里巴巴在其官方推文中指出，QwQ-32B在數學推理和編碼任務中表現尤其出色。 Ollama和Groq也宣布已支援此模型，使用者可在第三方應用程式上使用，並透過Groq的基礎架構實現創紀錄的推理速度。

然而，QwQ-32B也存在一些限制。例如，它在語言混合方面可能出現困難，並可能陷入影響效率的遞迴推理循環；此外，如同其他中國AI模型，它遵守當地法規，可能限制其對政治敏感話題的回應，且上下文窗口限制在32K tokens。

儘管如此，QwQ-32B以Apache 2.0許可證開源釋出，與許多來自美國和西方國家、僅限付費使用的先進AI系統形成鮮明對比。此舉緊隨阿里巴巴一月發布Qwen 2.5-Max之後，當時阿里巴巴宣稱該模型幾乎全面超越競爭對手。這兩次發布都凸顯了中國科技公司在快速發展的AI領域所面臨的激烈競爭。

特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」

值得關注的是，美國總統特朗普曾將中國AI模型的表現形容為對矽谷的「警鐘」，但也視其為「機遇而非威脅」。 DeepSeek R1發布時曾引發股市大幅下跌，但QwQ-32B的發布並未造成類似影響，納斯達克綜合指數的下跌主要歸因於政治因素，而非對阿里巴巴影響力的恐懼、不確定性和懷疑（FUD）。

阿里巴巴表示，QwQ-32B只是其在強化學習方面提升推理能力的初步步驟，相信結合更強大的基礎模型與規模化計算資源驅動的強化學習，將有助於更接近實現人工通用智能（AGI）的目標。此模型的出現，無疑將對全球AI產業格局帶來深遠的影響。

Related News

新火研究院指出比特幣突破74,000美元，比特幣現貨CVD轉正，市場底部構築大致完成。Coinbase溢價指數近十週首度轉正，現貨CVD同步回升，OTC交易量較2月日均暴增441%。ETF連續淨流入逾7.6億美元，交易所持續大額流出，顯示市場從賣方主導轉向買方累積階段。

市場結構逆轉！比特幣現貨CVD轉正、OTC交易量暴增441%，新火：底部構築完成

Crystal Hui6 hours ago18 hours ago 0

黃仁勳在GTC開發者大會點名OpenClaw爆紅，將其改編為企業級NemoClaw，強調代理型AI系統崛起。AI概念代幣集體大漲，NEAR、FET漲逾10%，Worldcoin與GRASS創多月新高。市場將此解讀為對去中心化AI基礎設施的潛在背書，押注自主代理將依賴加密軌道進行經濟活動。

黃仁勳一句話加密市場掀波瀾！OpenClaw爆紅背後去中心化AI敘事再起

Crystal Hui16 hours ago17 hours ago 0

香港中小企專用免費 AI 慳錢計算器。輸入公司資料，5分鐘即知每月可節省幾多人力成本。AI 方案比傳統人工慳73%，涵蓋餐飲、零售、地產等8大行業。立即計算！

AI 慳錢計算器｜香港中小企每月可以慳幾多？即時計出來

老闆維基18 hours ago18 hours ago 0

Bitmine斥資1.2億美元加倉以太坊，總持倉突破453萬枚，佔以太坊流通供應量3.76%，穩居最大企業持有者地位。公司追求「5%煉金術」目標，並已將三分之二持倉投入質押，年化收益約1.74億美元。董事長Tom Lee稱數字資產正處「迷你加密寒冬」最後階段，逆勢買盤彰顯長期信心。

目標「5%煉金術」！Bitmine斥資1.2億美元加倉以太坊，Tom Lee：寒冬最後階段

Admin4 days ago1 week ago 0