研究揭AI開始識「講大話」兼具野心科學家警告：人類不加控最終遭奪權或滅絕

大視野

研究揭AI開始識「講大話」兼具野心科學家警告：人類不加控最終遭奪權或滅絕

2024年05月12日 17:20 最後更新：05月14日 16:58

美國一項最新研究報告，證實人工智慧（AI）曾經在遊戲中說謊，警告如不及早防範，人類最終會遭奪權甚至滅亡。

研究報告在模式期刊發表

《ScienceAlert》報道，麻省理工學院（Massachusetts Institute of Technology）針對AI存在安全的研究員帕克（Peter Park），在「模式」（Patterns）期刊發表的文章指出，原本設計為誠實不欺的現有AI系統，已發展出令人不安的說謊技巧，例如欺騙線上遊戲的人類玩家，或說謊以僱用人類來解決「我不是機器人」的驗證。

AI行為可能變得不受控且無法預測

帕克指出能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培育的程序逐漸「成長」，也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且無法預測。

AI系統Cicero表現異常

研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。根據2022年發表在「科學」（Science）期刊的報告，Cicero在遊戲中表現優異，所獲分數可排在資深人類玩家的前10%。帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。

Cicero欺騙人類偷偷通風報信

但當帕克與同事深究完整資料時，發現完全是另一回事。舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。

AI野心大會追求權力及掌控社會

在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。研究報告警告，在最糟糕的情況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合AI「不為人知的目標」，人類可能慘遭奪權、甚至滅絕。

Tags:

OpenAI

往下看更多文章

AI接管新聞界？意大利媒體發行世界首份AI生成版報紙

意大利報紙《Il Foglio》表示已經製作出了世界上第一份完全由人工智慧（AI）生成的報紙，此舉是為期一個月的新聞試驗，旨在展示AI技術對人們日常生活的影響。

Italian newspaper says it has published world’s first AI-generated edition - Il Foglio AI sul @guardian https://t.co/G9c8cZXBz9
— Claudio Cerasa (@claudiocerasa) March 18, 2025

世界上首份完全使用AI製作的報攤日報

據外媒報導，這份四頁的大開本報紙《Il Foglio AI版》已經可以在報攤和網上買到。編輯塞拉薩（Claudio Cerasa）表示，這將是世界上第一份完全使用人工智慧製作的報攤日報，「從所有方面，人工智慧被用於寫作、起標題、寫引語、總結，有時甚至是諷刺。」他補充說，記者的角色將僅限於「（向人工智慧工具）提問並閱讀答案」。

觀看影片

報道涵蓋政治經濟等方面

《Il Foglio AI版》在頭版刊登了一篇關於美國總統特朗普（Donald Trump）的報導，描述了「意大利特朗普主義者的悖論」，以及他們如何抱怨「取消文化」，但當「他們在美國的偶像表現得像個香蕉共和國的暴君」時，他們要麼視而不見，要麼「大肆慶祝」。

另一篇文章指出，意大利國家統計局（Istat）關於收入再分配的最新報告顯示，意大利所得稅改革使得約75萬名工人的工資增加。這是一篇罕見的關於意大利經濟的樂觀報導。

AI的回答幽默有趣

報紙第二頁是一篇關於「狀態戀情」的文章，最後一頁則是由人工智慧生成的讀者寫給編輯的信，其中一封詢問了人工智慧是否會在未來讓人類變得「無用」。人工智慧生成的回復寫道，「人工智慧是一項偉大的創新，但它還不知道如何在不放錯糖的情況下點咖啡。」

Italy's Il Foglio just launched the first fully AI-generated newspaper, making history. This leap into automation raises questions about creativity and the future of journalism. Are we ready to embrace algorithmic writers over human storytellers? pic.twitter.com/4zIkjQjQ34
— Pablo Carmona Esparza (@pblcrmn) March 18, 2025