美國一項最新研究報告,證實人工智慧(AI)曾經在遊戲中說謊,警告如不及早防範,人類最終會遭奪權甚至滅亡。
研究報告在模式期刊發表
《ScienceAlert》報道,麻省理工學院(Massachusetts Institute of Technology)針對AI存在安全的研究員帕克(Peter Park),在「模式」(Patterns)期刊發表的文章指出,原本設計為誠實不欺的現有AI系統,已發展出令人不安的說謊技巧,例如欺騙線上遊戲的人類玩家,或說謊以僱用人類來解決「我不是機器人」的驗證。
AI行為可能變得不受控且無法預測
帕克指出能深度學習的AI系統不像傳統軟體那樣由「編寫」而成,而是透過類似選擇性培育的程序逐漸「成長」,也就是說,AI的行為在訓練背景下看似可預測、可控制,但有可能轉眼就變得不受控制且無法預測。
AI系統Cicero表現異常
研究始於科技公司Meta的AI系統Cicero,這套系統最初設計目的是玩一款名為「外交」(Diplomacy)的戰略遊戲,獲勝關鍵是結盟。根據2022年發表在「科學」(Science)期刊的報告,Cicero在遊戲中表現優異,所獲分數可排在資深人類玩家的前10%。帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上誠實且有幫助」,且「絕不會蓄意在背後搞鬼」。
Cicero欺騙人類偷偷通風報信
但當帕克與同事深究完整資料時,發現完全是另一回事。舉例來說,在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀,欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭,卻偷偷向德國通風報信。
AI野心大會追求權力及掌控社會
在另一個引人注意的案例中,科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損的人,在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。研究報告警告,在最糟糕的情況下,具有超凡智慧的AI可能會追求權力及掌控社會,如果符合AI「不為人知的目標」,人類可能慘遭奪權、甚至滅絕。