DeepSeek是什麼?中國以低廉成本匹敵OpenAI NVDA應聲暴跌(附試用連結)

DeepSeek是什麼

中國AI研究團隊DeepSeek近日發布其全新研發的R1模型,在效能上與OpenAI最先進的推理系統不相伯仲,甚至在某些測試中表現更佳。更令人矚目的是,DeepSeek R1完全免費且開源,其訓練成本僅為OpenAI同級模型的2%,徹底顛覆了AI產業的既有格局。自一月底DeepSeek公佈後,NVDA股價明顯下跌,反之中國相關概念股,包括美圖(1357)、商湯等急升。

即加入CFTime TG 讨论区!想掌握最新加密市场动态与 AI 新闻与资讯,更能随时获得免费 web 3入场券!

DeepSeek是什麼?模型採用大規模強化學習訓練

DeepSeek-R1-Zero模型採用大規模強化學習(RL)訓練,並未經過傳統的監督式微調(SFT)。研究論文指出,此模型展現出卓越的推理能力,其學習方式更貼近人類的試錯學習過程。 強化學習讓模型在不斷嘗試與回饋中自我提升,無需大量人工標註數據。

傳統上,人工智能研究一直認為,持續的計算能力是釋放 AI 真正決策潛力的關鍵。這導致業界高度重視開發強大的硬件,通常成本高昂。然而,DeepSeek 通過展示替代方法同樣有效,徹底顛覆了這一觀點。

DeepSeek 的成功秘訣在於其創新的軟件架構和優化算法。通過利用現有硬件並開發能夠高效使用這些資源的軟件,DeepSeek 實現了與依賴大量計算資源的 AI 架構相媲美的性能。

在AIME 2024數學基準測試中,DeepSeek R1取得79.8%的成功率,超越OpenAI的o1推理模型。在程式編碼測試平台Codeforces,其Elo評級達到2029,勝過96.3%的人類競爭者,展現出專家級水平。

DeepSeek是什麼?中國以低廉成本匹敵OpenAI NVDA應聲暴跌(附試用連結)

DeepSeek R1的經濟效益更令人驚豔。其查詢成本僅為每百萬個token 0.14美元,相比OpenAI o1的7.50美元,足足降低了98%。 MIT許可證下的完全開源特性,讓全球開發者都能自由使用、修改和再分發此模型。

DeepSeek是什麼?中國以低廉成本匹敵OpenAI NVDA應聲暴跌(附試用連結)
DeepSeek R1的經濟效益比較

業界反應:OpenAI模式受DeepSeek挑戰,開源AI時代來臨?

DeepSeek R1的釋出在AI業界掀起軒然大波,多位領袖人物紛紛發表評論,肯定其突破性意義。輝達首席研究員Jim Fan博士更指出,DeepSeek R1實現了OpenAI最初「開放研究,賦能所有人」的理想。他特別強調DeepSeek採用強化學習的成功,以及其透明地公開原始演算法和訓練曲線的做法,與業界常見的炒作宣傳形成強烈對比。

蘋果研究員Awni Hannun更指出,DeepSeek R1的量化版本可在蘋果Mac上運行,顯示蘋果設備在AI運算能力上的提升。AI研究員Alex Cheema更成功利用8台Mac Mini組成集群,運行完整DeepSeek R1模型,成本仍遠低於運行其他頂尖AI模型所需的伺服器。

Stability AI創辦人Emad Mostaque則以挑釁的語氣指出,DeepSeek R1的出現,將對那些投入巨資卻無法超越其效能的AI實驗室造成巨大壓力。科技企業家Arnaud Bertrand更直言,DeepSeek R1的出現,如同以30美元的價格推出能與iPhone匹敵的手機,將嚴重衝擊OpenAI等商業AI模型的市場地位。

Perplexity AI執行長Arvind Srinivas則從市場角度分析,DeepSeek R1基本複製了OpenAI o1 mini的功能,並以開源方式釋出,顯示推理能力正在快速商品化。他更表示,Perplexity Pro未來將整合DeepSeek R1的推理能力。

DeepSeek超越OpenAI,更具人性化

記者進行了簡單測試,比較DeepSeek R1與OpenAI o1在解決「Strawberry這個單字中有多少個R」的問題上的表現。兩者都成功解答,但DeepSeek R1的推理過程更冗長,更像人類的思考模式,使用了例如「Okay, let me figure (this) out」、「Hmmm」、「Wait, no. Wait, let’s break it down」等詞語。

在另一項基於BIG-bench數據集的「偵探推理」測試中,OpenAI的ChatGPT在測試中崩潰,而DeepSeek R1則在106秒內給出正確答案,並展現自我修正能力。

Hugging Face數據科學家Vaibhav Srivastav更指出,即使是僅有15億參數的DeepSeek R1量化版本,也能與GPT-4o和Claude 3.5 Sonnet匹敵。

DeepSeek R1目前已在Github和Hugging Face平台上公開,使用者可自由下載、運行、修改,甚至移除審查機制,並根據自身需求進行微調。DeepSeek更提供線上網頁入口網站,作為免費、開源的AI聊天機器人替代方案。 此舉無疑將加速開源AI的發展,並對整個AI產業格局帶來深遠影響。

zh_CN简体中文