評估推理能力

研究發現ChatGPT表現下降速度驚人「用戶需要調整使用心態」

Admin3 years ago3 years ago01 mins

一項由加州大學柏克萊分校和斯丹福大學的研究人員進行的新研究發現，OpenAI 開發的ChatGPT表現下降明顯，甚至可能越來越差。掌握最新加密市場動態與 AI （ChatGPT）新聞與資訊，請即追蹤 CFTime Facebook 及 Threads 專頁！研究人員分析了 ChatGPT 的不同版本，並開發了嚴格的基準來評估模型在數學、編碼和視覺推理任務方面的能力。結果顯示，ChatGPT 的表現出現了驚人的下降。相關新聞：8大用ChatGPT賺錢的方法一次可賺數千美元收入? ChatGPT表現在數學領域及執行生成百分比急跌測試顯示，在判定質數的數學挑戰中，ChatGPT準確率從 3 月份的 97.6% 下降至 6 月份的 2.4%。在聊天機械人的軟件編碼能力方面，下降尤其明顯。此外，研究人員利用了來自抽象推理語料庫（ARC）數據集的視覺提示來評估推理能力，可觀察到明顯下滑。研究亦發現，針對 GPT-4 直接可執行的生成百分比從 3 月份的52％下跌至 6 月份的10.0％。這些結果是通過使用純版本的模型獲得的，這意味著沒有涉及代碼解釋器插件。往往只會給出冗長、間接的回答研究人員假設，這可能是 OpenAI 開發 ChatGPT 時更新的副作用之一，例如為了防止 ChatGPT 回答危險問題而引入的更改。然而，這種安全對齊可能會減少 ChatGPT 對其他任務的用處。研究人員發現，現在模型往往會給出冗長、間接的回答，而不是清晰的答案。 AI 專家 Santiago Valderrama 在 Twitter 上提出了一種可能性，即「更便宜、更快」的模型混合，可能取代了原始的 ChatGPT 架構。他假設有傳言說 OpenAI 正在使用幾個較小、較專門的 GPT-4 模型，這些模型的作用類似於一個大模型，但運行成本更低。他認為，這可能會加速用戶的回應速度，但會降低模型的能力。 NVIDIA 高級人工智能科學家…

研究發現ChatGPT表現下降速度驚人 「用戶需要調整使用心態」

研究發現ChatGPT表現下降速度驚人「用戶需要調整使用心態」