AI西洋棋 - cftime.io

Sam Altman完勝馬斯克！ GPT西洋棋碾壓Grok4 暴露LLM致命缺陷

Admin8 months ago8 months ago01 mins

Sam Altman完勝馬斯克！日前Google Kaggle Game Arena舉辦了一場備受矚目的AI西洋棋表演賽，Sam Altman 的 OpenAI o3 模型（已隨 GPT-5 發布而停止使用）以四比零的絕對優勢擊敗馬斯克的 xAI Grok 4 模型， GPT西洋棋碾壓Grok4，引發業界對大型語言模型（LLM）在專業遊戲領域能力的重新思考。即加入CFTime TG 討論區！想掌握最新加密市場動態與 AI 新聞與資訊，更能隨時獲得免費 web 3入場券！這場為期三天的比賽（8月5日至7日）別具特色，參賽的通用型聊天機械人，例如 OpenAI o3 和 xAI Grok 4，均未接受任何專業的西洋棋訓練，僅依靠從網路上學習到的知識進行比賽。比賽結果顯示，這些號稱接近人類智慧水平的 AI，其西洋棋水平卻令人大跌眼鏡。世界西洋棋冠軍 Magnus Carlsen 將兩款 AI 的棋力評估為約 800 ELO，遠低於他本人 2839 分的 Elo 等級，甚至不如近期才學會規則的業餘玩家。 Carlsen 形容 AI 的表現為「在非常好的棋步和令人費解的連續棋步之間搖擺不定」，甚至戲稱 Grok 的走法像是「在玩國王山」。比賽過程充斥著低級失誤。Grok 在首局比賽中輕易送出重要棋子，之後更在劣勢下持續交換棋子，雪上加霜。第二局比賽，Grok 嘗試執行「毒兵」策略卻抓錯棋子，導致皇后被俘。第三局比賽，Grok 建立了看似穩固的陣型，卻在中局連續損失多枚棋子。值得注意的是，Grok…