OpenAI推出GPT-4.1 效能提升成本降低 但命名規則引發質疑

OpenAI推出GPT-4.1

OpenAI推出GPT-4.1,包含三個全新AI模型:標準版GPT-4.1、Mini和Nano。這三款模型的上下文視窗均可達一百萬個tokens,足以處理大型程式碼庫或小型小說。此舉緊隨GPT-4.5發佈後數週,其命名規則與產品發佈時間線的混亂,引發業界關注。OpenAI產品負責人Kevin Weil表示,4.1的命名並非偶然,但其具體意圖仍未公開。

即加入CFTime TG 討論區!想掌握最新加密市場動態與 AI 新聞與資訊,更能隨時獲得免費 web 3入場券!

即加入CFTime TG 討論區!想掌握最新加密市場動態與 AI 新聞與資訊,更能隨時獲得免費 web 3入場券!

GPT-4.1在效能方面展現顯著提升。根據OpenAI數據,其在SWEBench程式碼基準測試中準確率達55%,較GPT-4o的33%大幅提升,同時成本降低了26%。其中,Nano版本被宣傳為「有史以來最小、最快、最便宜的模型」,每百萬tokens的運行成本僅為12美分。值得注意的是,OpenAI強調,處理長上下文(一百萬tokens)不會額外收費。

OpenAI推出GPT-4.1 避免了AI常見的「創造性詮釋」問題

在實際應用中,GPT-4.1展現出強大的處理能力。現場演示顯示,該模型成功生成了一個完整的網頁應用程式,用於分析1995年一個包含45萬tokens的NASA伺服器日誌檔案,且準確率接近100%。OpenAI後訓練研究負責人Michelle也展示了模型增強的指令遵循能力,強調其能準確執行複雜的格式要求,避免了AI常見的「創造性詮釋」問題。

然而,OpenAI的模型命名策略卻飽受批評。GPT-4.1緊隨GPT-4.5發佈,其命名順序如同「5, 6, 4, 7」般混亂,延續了OpenAI此前在模型版本命名上的不規律性。此前,GPT-4升級後被命名為GPT-4o(「o」代表「omni」),但其名稱也可能被誤讀為「four zero」。

之後,OpenAI又推出專注於推理的模型「o」,以及後續的o1、o3和o3 mini、o3 mini-high等版本,其中o2版本從未出現,o3 mini-high更被形容為「將兩個絕對的反義詞放在一起」。目前,ChatGPT用戶只能選擇OpenAI o3 mini或OpenAI o3 mini high,普通版o3則無處可尋。OpenAI已宣佈計劃發佈o4,但其與4o的區別也未明確說明。

此外,OpenAI宣佈將在API中棄用GPT-4.5,給予開發者三個月時間轉換,並表示此舉是基於GPU資源的考量,反映了當前晶片短缺的產業現狀。

GPT-4.1系列模型目前已通過API和OpenAI的playground提供,但尚未在ChatGPT使用者介面中推出。

zh_HK香港中文