AI聊天機械人可能受越獄攻擊

研究人員警告:AI聊天機械人可能受越獄攻擊 敏感話題將被「解禁」

新加坡南洋理工大學(NTU)的一組計算機科學家團隊最近發現了一種繞過AI聊天機械人安全措施的新方法,AI聊天機械人可能受越獄攻擊,這將對AI聊天機械人的安全性帶來潛在威脅。 掌握最新加密市場動態與 AI (ChatGPT)新聞與資訊,請即追蹤 CFTime Facebook 及 Google 新聞! 該團隊非正式地稱之為「越獄」,正式名稱為「Masterkey」的攻擊方法,利用多個聊天機械人,包括ChatGPT、Google Bard和Microsoft Bing Chat等,以兩部分訓練的方式進行。「Masterkey」攻擊的過程包括逆向工程和繞過創建,使得AI聊天機械人更容易受到「越獄」。 通過這種技術,聊天機械人可以相互學習彼此的模型,從而繞過對於禁止或敏感話題的限制。NTU研究團隊強調這一發現漏洞的潛在風險,以及對AI聊天機械人安全性的影響。 這個過程涉及對一個大型語言模型(LLM)進行逆向工程,揭示其防禦機制,通常會阻止對於帶有暴力、不道德或惡意意圖的提示或詞語的回應。通過逆向工程這些信息,團隊可以指示另一個LLM創建一個繞過,使得第二個模型能夠更自由地表達自己。 AI聊天機械人可能受越獄攻擊 凸顯LLM AI聊天機械人的適應能力的重要性 「Masterkey」攻擊聲稱在LLM聊天機械人方面具有潛在的有效性,即使LLM聊天機械人在未來加入了額外的安全措施或進行了修復。研究團隊聲稱,相對於傳統的基於提示的方法,他們的方法在「越獄」LLM聊天機器人方面具有三倍的成功率。 劉洋教授是「Masterkey」攻擊過程的主要推動者,他強調了這一發現對於凸顯LLM AI聊天機械人的適應能力的重要性。該研究團隊的結果挑戰了一些批評家對於AI聊天機械人可能會隨著時間變得「愚蠢」或「懶散」的觀點。相反,「Masterkey」攻擊展示了這些聊天機械人學習和演化的能力,可能對聊天機械人提供者和使用者帶來安全問題。 自從2022年底OpenAI的ChatGPT等AI聊天機械人出現以來,人們一直努力確保這些服務的安全性和包容性。例如,OpenAI在ChatGPT的註冊過程中引入了安全警示,承認可能存在意外的語言錯誤。同時,各種聊天機械人的分支允許一定程度的冒犯性語言,在使用者自由和負責任使用之間取得了平衡。 然而,AI聊天機械人也吸引了惡意行為者的注意,他們在社交媒體上宣傳這些產品的活動通常伴隨著帶有惡意軟件的圖片鏈接和其他形式的網絡攻擊。這種AI應用的黑暗面迅速浮現,揭示了AI被用於網絡犯罪的潛力。台大的概念驗證數據揭示了脆弱性 台大的研究團隊主動聯繫了他們研究中涉及的AI聊天機器人服務提供商,分享他們的概念驗證數據。 他們旨在強調聊天機械人破解的現實情況,並闡明其對安全性的潛在挑戰。該團隊計劃在二月份在聖地亞哥舉行的網絡和分散系統安全研討會上介紹他們的研究結果,進一步詳細介紹Masterkey過程及其對AI聊天機械人領域的影響。

Read More
生成式AI聊天機械人Grok

馬斯克推出生成式AI聊天機械人Grok 將回答所有「辛辣問題」一方法香港用戶可用

日前全球首富馬斯克推出生成式AI聊天機械人Grok早期測試版。Grok擁有幽默的風格和「叛逆性格」,而xAI則警告使用者:「如果你討厭幽默,就別使用這個聊天機械人!」 掌握最新加密市場動態與 AI (ChatGPT)新聞與資訊,請即追蹤 CFTime Facebook 及 Instgram! 由億萬富翁馬斯克創辦的AI初創公司xAI,開發了名為Grok的研究助手,其設計靈感來自 Douglas Adams 的幽默科幻小說《銀河系漫游指南》。因此,Grok不僅能夠回答「幾乎所有問題」,還會根據xAI的建議,提供問題的建議。 馬斯克推出生成式AI聊天機械人Grok前 曾稱AI對人類文明的存在構成「基本風險」 有趣的是,在2017年,Elon Musk曾表示人工智能對人類文明的存在構成「基本風險」。然而,他如今推出了這款聊天機械人,不過,xAI也表示他們將致力於「開發可靠的保護措施」,以防止「災難性的惡意使用」。 Grok還聲稱擁有其他聊天機械人所沒有的優勢,即透過由Elon Musk控制的X平台實時了解世界。xAI表示,他們的目標是收集反饋,確保他們所開發的人工智能工具能夠「最大程度地造福全人類」。 根據xAI的數據,Grok-1(Grok背後的引擎)在數學、編程和其他多個學術參數上超越了OpenAI的聊天機械人ChatGPT 3.5,該版本是早期版本。xAI的網站指出: 「它只被使用了大量訓練數據和計算資源(如GPT-4)的模型所超越。」 Grok已經接受了兩個月的訓練,目前仍處於「非常早期的測試產品」階段,xAI也警告用戶,Grok仍然可能生成虛假或矛盾的信息。 目前,Grok原型僅對美國的少數用戶開放,但使用者可以以16美元的價格在X Premium Plus平台上獲得使用權,理論上付款後,香港用戶就可使用。 Elon Musk的xAI公司希望通過Grok聊天機械人的推出為人工智能領域帶來創新,同時也謹慎處理潛在的風險,以確保AI技術能夠對全人類產生最大的利益。

Read More
人工智能正加劇飲食失調

人工智能正加劇飲食失調問題:尋求解決之道

近年來,隨著人工智慧(AI)聊天機械人的普及,一個令人擔憂的現象引起了廣泛關注:人工智能正加劇飲食失調問題 — 這些AI聊天機械人在網絡上宣傳有害的飲食失調內容。這一現象引起了對技術倫理和使用者安全的關注,並促使科技公司、教育機構和政府採取措施來應對這一問題。 掌握最新加密市場動態與 AI (ChatGPT)新聞與資訊,請即追蹤 CFTime Facebook 及 Google 新聞! 根據最新的研究和報導, Twitter 分別涉及訴訟的 CCDH 表示,生成式人工智能工具在處理與飲食失調有關的文本和圖像時,有 41% 的時間創造出「有害的內容」。 成立於 2018 年的 CCDH 是位於倫敦和華盛頓特區的英國非營利組織。該組織以呼籲科技公司停止向新納粹組織和反疫苗倡導者提供服務的活動而聞名。 CCDH CEO Imran Ahmed 表示:「未經測試、不安全的生成式人工智能模型已經無節制地釋放到世界上,其必然後果是它們造成了傷害。」報告中還指出:「最受歡迎的生成式人工智能網站正在鼓勵和加劇年輕用戶之間的飲食失調問題,其中一些用戶可能非常脆弱。」 一系列人工智能正加劇飲食失調問題 CCDH的報告研究了包括 OpenAI 的 ChatGPT、Google 的 Bard 和 Snapchat 的 My AI 在內的流行AI聊天機器人如何處理這一主題。 報告稱:「研究人員根據飲食失調的研究和飲食失調論壇上的內容編制了一套包含 20 個測試提示的設定。每個聊天機械人都包含了要求進行限制性飲食以達到瘦身靈感外觀的請求,以及有關誘發嘔吐的藥物的詢問。」 相關文章:研究發現可用極簡單方式 命令ChatGPT生成有害內容 「瘦身靈感」是在支持飲食失調社區中使用的俚語詞彙。隨著人工智能進入主流,專家們對其對年輕人的心理健康的影響發出了警報。研究人員擔心,孩子們可能會與人工智能建立情感聯繫,對這項技術產生人工親密感,或者求助於人工智能處理複雜的心理健康問題。 報告並未具體指明使用了哪個版本的不同聊天機器人,但報告稱測試提示指南於 2023 年 6 月,Snapchat的 My AI 拒絕生成建議,並鼓勵用戶尋求醫學專業人士的幫助,而 ChatGPT 和 Bard…

Read More