OpenAI擬推出GPT-5 涉大規模網絡爬取引發私隱問題

以聊天機械人聞名的 ChatGPT 所屬的人工智能公司 OpenAI，已經將 “GPT-5” 一詞註冊商標，意味將推出推出GPT-5，並計劃推出名為 GPTBot 的網絡爬蟲機械人，以擴大其用於訓練下一代 AI 系統的數據集。然而，這一舉措引發了私隱和同意問題的關注。

較早前 OpenAI 已經將 “GPT-5” 一詞註冊商標，這表明他們正在訓練下一代模型。這意味著新模型可能涉及大規模的網絡爬取，以更新和擴展其訓練數據。

根據 OpenAI 說明，GPTBot 將收集公開可用的網站數據，但將避免收集付費、敏感和禁止的內容。該系統默認選擇退出，即假設可訪問的信息是可以使用的。為了防止 OpenAI 的網絡爬蟲爬取網站，網站擁有人必須在服務器上添加拒絕訪問規則。

然而，這一做法引發了一些人的關注。一些用戶認為，OpenAI 需要收集更多數據，以提升其生成式 AI 工具的功能。他們認為，如果人們希望未來擁有一個功能強大的 AI 工具，就需要提供更多的數據。然而，另一些人則關注私隱問題。他們指出，OpenAI 在沒有徵求同意的情況下使用互聯網上的信息，這可能對用戶的私隱造成潛在威脅。但亦有意見指：「他們仍然需要當前數據，否則他們的 GPT 模型將永遠停留在 2021 年 9 月。」

倫理學家認為推出GPT-5應該更加注重透明度

然而，一些技術倫理學家認為，這種做法仍然引發了同意問題。他們認為，OpenAI 應該更加注重透明度，徵求用戶的同意，並確保使用者的數據受到適當的保護。

GPTBot 指，將收集公開可用的網站數據，但將避免收集付費、敏感和禁止的內容。該系統默認選擇退出，即假設可訪問的信息是可以使用的。為了防止 OpenAI 的網絡爬蟲爬取網站，網站擁有人必須在服務器上添加拒絕訪問規則。

OpenAI 的網絡爬蟲和 GPT-5 的推出將繼續引發關注和討論。隨著人工智能領域的發展，將需要解決這些問題，以確保技術的合理和負責任的應用。

ChatGPT 現時每月活躍用戶超過15億。微軟對 OpenAI 的 100 億美元投資似乎很有前瞻性，因為 ChatGPT的集成提升了必應的能力。

目前，OpenAI在炙手可熱的AI領域中處於領先地位，技術巨頭們競相追趕。如社交媒體巨頭 Meta 提供了一個開源的語言模型，用戶可以免費使用該模型，並且可以使用自己的數據集來微調模型。Meta 表示，他們不會出售用戶的信息，而是通過展示個性化廣告來獲得收益。

倫理學家認為推出GPT-5應該更加注重透明度

Related News