OpenAI擬推出GPT-5 涉大規模網絡爬取 引發私隱問題

推出GPT-5

以聊天機械人聞名的 ChatGPT 所屬的人工智能公司 OpenAI已經將 “GPT-5” 一詞註冊商標,意味將推出推出GPT-5,並計劃推出名為 GPTBot 的網絡爬蟲機械人,以擴大其用於訓練下一代 AI 系統的數據集。然而,這一舉措引發了私隱和同意問題的關注。

較早前 OpenAI 已經將 “GPT-5” 一詞註冊商標,這表明他們正在訓練下一代模型。這意味著新模型可能涉及大規模的網絡爬取,以更新和擴展其訓練數據。

根據 OpenAI 說明,GPTBot 將收集公開可用的網站數據,但將避免收集付費、敏感和禁止的內容。該系統默認選擇退出,即假設可訪問的信息是可以使用的。為了防止 OpenAI 的網絡爬蟲爬取網站,網站擁有人必須在服務器上添加拒絕訪問規則。

然而,這一做法引發了一些人的關注。一些用戶認為,OpenAI 需要收集更多數據,以提升其生成式 AI 工具的功能。他們認為,如果人們希望未來擁有一個功能強大的 AI 工具,就需要提供更多的數據。然而,另一些人則關注私隱問題。他們指出,OpenAI 在沒有徵求同意的情況下使用互聯網上的信息,這可能對用戶的私隱造成潛在威脅。但亦有意見指:「他們仍然需要當前數據,否則他們的 GPT 模型將永遠停留在 2021 年 9 月。」

倫理學家認為推出GPT-5應該更加注重透明度

然而,一些技術倫理學家認為,這種做法仍然引發了同意問題。他們認為,OpenAI 應該更加注重透明度,徵求用戶的同意,並確保使用者的數據受到適當的保護。

GPTBot 指,將收集公開可用的網站數據,但將避免收集付費、敏感和禁止的內容。該系統默認選擇退出,即假設可訪問的信息是可以使用的。為了防止 OpenAI 的網絡爬蟲爬取網站,網站擁有人必須在服務器上添加拒絕訪問規則。

OpenAI 的網絡爬蟲和 GPT-5 的推出將繼續引發關注和討論。隨著人工智能領域的發展,將需要解決這些問題,以確保技術的合理和負責任的應用。

ChatGPT 現時每月活躍用戶超過15億。微軟對 OpenAI 的 100 億美元投資似乎很有前瞻性,因為 ChatGPT的集成提升了必應的能力。

目前,OpenAI在炙手可熱的AI領域中處於領先地位,技術巨頭們競相追趕。如社交媒體巨頭 Meta 提供了一個開源的語言模型,用戶可以免費使用該模型,並且可以使用自己的數據集來微調模型。Meta 表示,他們不會出售用戶的信息,而是通過展示個性化廣告來獲得收益。