OpenAI擬推出GPT-5 涉大規模網絡爬取引發私隱問題

以聊天機械人聞名的 ChatGPT 所屬的人工智能公司 OpenAI，已經將 “GPT-5” 一詞註冊商標，意味將推出推出GPT-5，並計劃推出名為 GPTBot 的網絡爬蟲機械人，以擴大其用於訓練下一代 AI 系統的數據集。然而，這一舉措引發了私隱和同意問題的關注。

較早前 OpenAI 已經將 “GPT-5” 一詞註冊商標，這表明他們正在訓練下一代模型。這意味著新模型可能涉及大規模的網絡爬取，以更新和擴展其訓練數據。

根據 OpenAI 說明，GPTBot 將收集公開可用的網站數據，但將避免收集付費、敏感和禁止的內容。該系統默認選擇退出，即假設可訪問的信息是可以使用的。為了防止 OpenAI 的網絡爬蟲爬取網站，網站擁有人必須在服務器上添加拒絕訪問規則。

然而，這一做法引發了一些人的關注。一些用戶認為，OpenAI 需要收集更多數據，以提升其生成式 AI 工具的功能。他們認為，如果人們希望未來擁有一個功能強大的 AI 工具，就需要提供更多的數據。然而，另一些人則關注私隱問題。他們指出，OpenAI 在沒有徵求同意的情況下使用互聯網上的信息，這可能對用戶的私隱造成潛在威脅。但亦有意見指：「他們仍然需要當前數據，否則他們的 GPT 模型將永遠停留在 2021 年 9 月。」