中國AI研究團隊DeepSeek近日發布其全新研發的R1模型,在效能上與OpenAI最先進的推理系統不相伯仲,甚至在某些測試中表現更佳。更令人矚目的是,DeepSeek R1完全免費且開源,其訓練成本僅為OpenAI同級模型的2%,徹底顛覆了AI產業的既有格局。自一月底DeepSeek公佈後,NVDA股價明顯下跌,反之中國相關概念股,包括美圖(1357)、商湯等急升。
即加入CFTime TG 讨论区!想掌握最新加密市场动态与 AI 新闻与资讯,更能随时获得免费 web 3入场券!
DeepSeek是什麼?模型採用大規模強化學習訓練
DeepSeek-R1-Zero模型採用大規模強化學習(RL)訓練,並未經過傳統的監督式微調(SFT)。研究論文指出,此模型展現出卓越的推理能力,其學習方式更貼近人類的試錯學習過程。 強化學習讓模型在不斷嘗試與回饋中自我提升,無需大量人工標註數據。
傳統上,人工智能研究一直認為,持續的計算能力是釋放 AI 真正決策潛力的關鍵。這導致業界高度重視開發強大的硬件,通常成本高昂。然而,DeepSeek 通過展示替代方法同樣有效,徹底顛覆了這一觀點。
DeepSeek 的成功秘訣在於其創新的軟件架構和優化算法。通過利用現有硬件並開發能夠高效使用這些資源的軟件,DeepSeek 實現了與依賴大量計算資源的 AI 架構相媲美的性能。
在AIME 2024數學基準測試中,DeepSeek R1取得79.8%的成功率,超越OpenAI的o1推理模型。在程式編碼測試平台Codeforces,其Elo評級達到2029,勝過96.3%的人類競爭者,展現出專家級水平。
DeepSeek R1的經濟效益更令人驚豔。其查詢成本僅為每百萬個token 0.14美元,相比OpenAI o1的7.50美元,足足降低了98%。 MIT許可證下的完全開源特性,讓全球開發者都能自由使用、修改和再分發此模型。
業界反應:OpenAI模式受DeepSeek挑戰,開源AI時代來臨?
DeepSeek R1的釋出在AI業界掀起軒然大波,多位領袖人物紛紛發表評論,肯定其突破性意義。輝達首席研究員Jim Fan博士更指出,DeepSeek R1實現了OpenAI最初「開放研究,賦能所有人」的理想。他特別強調DeepSeek採用強化學習的成功,以及其透明地公開原始演算法和訓練曲線的做法,與業界常見的炒作宣傳形成強烈對比。
蘋果研究員Awni Hannun更指出,DeepSeek R1的量化版本可在蘋果Mac上運行,顯示蘋果設備在AI運算能力上的提升。AI研究員Alex Cheema更成功利用8台Mac Mini組成集群,運行完整DeepSeek R1模型,成本仍遠低於運行其他頂尖AI模型所需的伺服器。
Stability AI創辦人Emad Mostaque則以挑釁的語氣指出,DeepSeek R1的出現,將對那些投入巨資卻無法超越其效能的AI實驗室造成巨大壓力。科技企業家Arnaud Bertrand更直言,DeepSeek R1的出現,如同以30美元的價格推出能與iPhone匹敵的手機,將嚴重衝擊OpenAI等商業AI模型的市場地位。
Perplexity AI執行長Arvind Srinivas則從市場角度分析,DeepSeek R1基本複製了OpenAI o1 mini的功能,並以開源方式釋出,顯示推理能力正在快速商品化。他更表示,Perplexity Pro未來將整合DeepSeek R1的推理能力。
DeepSeek超越OpenAI,更具人性化
記者進行了簡單測試,比較DeepSeek R1與OpenAI o1在解決「Strawberry這個單字中有多少個R」的問題上的表現。兩者都成功解答,但DeepSeek R1的推理過程更冗長,更像人類的思考模式,使用了例如「Okay, let me figure (this) out」、「Hmmm」、「Wait, no. Wait, let’s break it down」等詞語。
在另一項基於BIG-bench數據集的「偵探推理」測試中,OpenAI的ChatGPT在測試中崩潰,而DeepSeek R1則在106秒內給出正確答案,並展現自我修正能力。
Hugging Face數據科學家Vaibhav Srivastav更指出,即使是僅有15億參數的DeepSeek R1量化版本,也能與GPT-4o和Claude 3.5 Sonnet匹敵。
DeepSeek R1目前已在Github和Hugging Face平台上公開,使用者可自由下載、運行、修改,甚至移除審查機制,並根據自身需求進行微調。DeepSeek更提供線上網頁入口網站,作為免費、開源的AI聊天機器人替代方案。 此舉無疑將加速開源AI的發展,並對整個AI產業格局帶來深遠影響。