Skip to Content Facebook Feature Image

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?
博客文章

博客文章

OpenAI新AI模型GPT-4o或將重塑人機互動 教師、同聲傳譯要失業?
AI手機還會遠嗎?

2024年05月15日 11:32 最後更新:11:46

當地時間5月13日10時,OpenAI首席技術官Mira Murati在全球矚目的春季發佈會上揭幕了新一代AI巨擘——GPT-4o。這款全能型AI模型以其超乎尋常的實時多模態對話能力,引發全球關注。

OpenAI首席技術官Mira Murati。

OpenAI首席技術官Mira Murati。

據《華爾街見聞》,GPT-4o的特性在於其高度的即時響應和表達能力,如同真實人類一般,能夠同時處理文字、圖像、視頻和語音信息,且接受和中斷對話自如。OpenAI創始人Sam Altman暗示了GPT-4o強大的擬人化能力,他在社交平台上引用了電影《Her》中的概念,預示人機交互或開啓新篇章。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

電影《Her》中,男主角愛上了一個像人類一樣「有血有肉」的AI。

Murati宣佈,相較於GPT-4 Turbo,GPT-4o速度提升了兩倍,開放API接口的同時,用戶請求速率上限提升至之前的五倍。

更為引人關注的是,這一先進模型將全面免費開放,惠及ChatGPT的所有用戶,取消其他所有限制,API價格降低50%。

發佈會還展示了桌面版ChatGPT及全新用戶界面(UI)。

GPT-4o即日起逐步向用戶開放,未來還將增加語音和視頻理解等功能。

Murati稱,GPT-4o為每個用戶都提供了GPT-4級別的智能,同時還改進了GPT-4在文本、視覺以及音頻方面的能力。

借助GPT-4o,OpenAI通過跨文本、視覺和音頻端到端訓練了新模型,使得所有輸入和輸出都由同一神經網絡處理,進一步降低了延遲。

AP圖片

AP圖片

據稱,GPT-4o的語音響應延遲已顯著降低,平均為320毫秒,接近人類對話的反應速度。

演示環節,Murati邀研究主管Mark Chen和後訓練團隊負責人Barret Zoph共同展示了GPT-4o的強大功能,包括解方程、解讀代碼、實時翻譯,甚至能通過視頻識別面部情緒。

1)看圖指導解方程
演示中,Zoph在白板上寫了一個方程式3x+1=4,ChatGPT給他提示,引導他完成每一步解答,識別他的書寫結果,幫助他解出了X的值。

2)解讀屏幕信息
Zoph將一段Python代碼輸入ChatGPT,並讓ChatGPT用一句話總結這段代碼在做什麼。GPT回答無誤,並詳細說明瞭數據是如何被處理的。

隨後,Zoph又運行了這段代碼,GPT能夠準確地描述出所生成圖表的具體含義,包括圖表主題、XY軸信息、峰值水平。

3)實時交替翻譯
GPT還在演示中扮演了翻譯員的角色。應社交媒體X的用戶請求,Murati現場對ChatGPT說起了意大利語,GPT則將她的話翻譯成英語,轉告Zoph和Chen;聽完Murati說的意大利語,GPT再將其翻譯為英文並告訴Chen:「Mark,她(Murati)想知道鯨魚會不會說話,它們會告訴我們什麼?」 

4)通過視頻識別面部情緒
演示中,Zoph將手機舉到自己面前正對著臉,要求ChatGPT檢測他現在的情緒。最初,GPT參考了他之前分享的一張照片,將他識別為「木質表面」。經過第二次嘗試,GPT表示:「你看起來非常的開心,可能還有一點激動,看樣子你應該心情很不錯。」

Zoph贊揚了GPT的回答並表示自己正在進行一場演示,以展示「你有多不可思議」,此時GPT情緒頗為激動地表示:「快別說了!你讓我害羞了。」

這些演示彷彿證實了GPT-4o的特性,其「o」代表著「omni」,象徵著「全能」。

在後續的網絡實測視頻中,官方和用戶還探索出了GPT-4o的花樣玩法。

將老照片中的手寫字轉錄為電子文本。

將老照片中的手寫字轉錄為電子文本。

共享iPad屏幕後,讓GPT實時指導教學幾何題目。

和GPT視頻玩「石頭剪刀布」。

和GPT視頻玩「石頭剪刀布」。

正如Murati說,GPT-4o的發佈意味著OpenAI在大模型的易用性方面邁出了一大步,Ta正在改變人機交互的協作模式。

那麼,AI手機還會遠嗎?

此前有媒體報道透露,蘋果已經與OpenAI達成協議,將在全新操作系統iOS 18中引入ChatGPT技術,以升級Siri的對話體驗。

AP圖片

AP圖片

這不由令人猜想,GPT-4o和Siri將如何結合?OpenAI和蘋果會締造出具有跨時代意義的AI手機嗎?

英偉達高級研究科學家Jim Fan在X平台表示,iOS集成GPT技術可能會有三個層級:
1)放棄Siri。OpenAI為iOS提煉出更小型、純設備上的GPT-4o,並可選擇付費升級以使用雲。
2)將相機或屏幕傳輸到模型中的基礎功能。對神經音頻/視頻編解碼器的芯片級支持。
3)集成iOS系統操作API和智能家居API。Siri快捷方式是時候復活了。

有分析指出,蘋果和OpenAI的合作能夠解決彼此在發展邊緣AI方面的痛點,真正做到各取所需。

目前,有分析預測,蘋果將在6月10日的WWDC大會上官宣和OpenAI的合作夥伴關係,並推出基於蘋果LLM的AI聊天機器人。

AP圖片

AP圖片

令人激動的是,已經有移動端App開始接入GPT-4o了。

用於輔助盲人和弱勢群體日常生活的手機App Be My Eyes嘗試了接入GPT-4o,發現日常決策的效率被大大提高。

AP圖片

AP圖片

宣傳視頻顯示,一名盲人打開Be My Eyes後,能夠通過和GPT-4o對話,讓GPT詳細告訴他眼前的景象,從而快速做出決策。

有網友表示,這是GPT-4o的最佳用例,它將為視障人士創造一個全新的世界。

AP圖片

AP圖片

在所有演示結束後,Murati總結道:「正如大家所見,(如今的ChatGPT)真的很神奇。」




深喉

** 博客文章文責自負,不代表本公司立場 **

Tags:

理文OpenAI

往下看更多文章

美國情報機構滲透南亞有多深入? 看孟加拉政變就知道

2024年11月22日 12:08 最後更新:12:13

印度媒體《星期日衛報》(The Sunday Guardian)近期披露的一份文件,將一項由美國在背後支持、旨在策劃孟加拉政權更迭的「倡議」暴露於世人眼前。

2019年初這一「倡議」啓動後,美國官僚與各相關組織相互配合,共同對孟加拉的政治格局施加影響,動搖時任孟總理哈西娜(Sheikh Hasina)的領導地位。

孟加拉前總理哈西娜。AP資料圖片

孟加拉前總理哈西娜。AP資料圖片

該項「倡議」主要是由「國際共和研究所」(IRI)負責執行,「美國國家民主基金會」(NED)和「美國國際開發署」(USAID)為其提供資金支持,清晰凸顯出外國勢力干預他國內政所帶來的不安影響。

該文作者賽琳娜·格林(Selena Green)、馬赫什·德巴塔(Mahesh Ranjan Debata),揭示了此前孟加拉政治風波背後的美國因素。以下為內地「南亞研究通訊」官方賬號編譯的全文:

一、PAIRS 計劃:政權更迭模板

這份名為「促進問責制、包容性、韌性支持」計劃(以下簡稱PAIRS)的戰略目的是削弱印度對孟加拉的政治影響。從相關內部文件可看出,該計劃是美國支持那些對其有著重大地緣政治利益國家內部民主體制、政治改革整體議程的組成部分。在USAID和NED的大量資金支持下,PAIRS計劃持續了將近兩年(確切而言是22個月),直至2021年1月才結束。期間,該計劃通過提供宣傳贈款、開展藝術項目、支持民間社會組織等一系列舉措,增強當地民眾政治參與,並為反專制勢力擴張提供支持。

PAIRS計劃採取多管齊下的策略,類似於美國在全球範圍內支持的其他抗議活動。在孟加拉,美國與伊斯蘭大會黨(Jamaat-e-Islami)等宗教極端主義組織以及由美國資助的「公民社會」團體合作,直接導致街頭暴力抗議,進一步加劇孟國內部緊張局勢。同時,這些公民社會團體充當了「持不同政見者」的公開代表,使受美國支持的政黨能夠在混亂中伺機壯大。

這其中的主要參與者,包括達卡大學的學生,如納希德·伊斯拉姆(Nahid Islam)和努斯拉特·塔巴蘇姆(Nusrat Tabassum),他們與美國、歐洲的「民主」倡議存在關聯。這種對教育機構的滲透行為,展現了外國利益集團借助當地參與者推進自身議程的過程,具有廣泛影響力。

極端分子領導的街頭陣線與學生抗議活動相互配合,反映出西方媒體認可的一種全球模式。例如,《衛報》曾對美國在東歐支持的政權更迭行動進行報道,詳細介紹了非暴力反抗行為影響當地選舉的過程。

與PAIRS計劃相關的「地緣政治考量文件」,揭示出美國的關鍵目標之一是對印度在孟加拉長達十年的影響力進行制衡。美國將印度政府對孟時任執政黨人民聯盟(Awami League)的支持描述為「存在問題」,試圖重塑南亞的政治動態,進而影響孟加拉的內政及印孟關係。上述舉措反映出美國在更廣泛地緣政治戰略中的精心謀劃,凸顯地區政治的複雜相互作用。伴隨地緣政治格局的演變,這些計劃致使孟加拉等國的民主、主權受損,外部影響有可能重新界定其國內的政治權力動態。

二、國家民主基金會受到審查

國家民主基金會(NED)的活動在國內外均遭到廣泛批判。前美國國會議員羅恩·保羅(Ron Paul)指責該基金會濫用美國納稅人的資金,去支持與美國利益相符的外國政客。他認為,NED 此舉看似是「促進民主」,實則是利用「軟資金」 操控外國選舉,嚴重違反了美國法律。

從歷史視角來看,國家民主基金會(NED)那些頗具爭議的做法曾遭受嚴格審視。回溯20世紀80年代,美國國會議員巴尼·弗蘭克(Barney Frank)就曾提議削減NED的資金,認為政府不應該將納稅人的錢,用於支持外國工會等帶有政治意圖的活動。

此外,《紐約時報》曾對國家民主基金會(NED)破壞海地民選政府,致該國陷入局勢動蕩的行徑進行報道。該報前記者斯蒂芬·金澤在《紐約書評》中透露,NED與中央情報局(CIA)及美國國際開發署(USAID)合作,支持那些能夠助力推翻對美國不利政治力量的勢力。這凸顯了一種干預主義模式,即試圖以犧牲當地民主與穩定為代價,增強「敵人的敵人」的力量。

除在孟加拉境內的活動外,NED還對中國台灣地區的活動予以資助。2022年,NED與民進黨相互勾結,共同舉辦了一場號稱「團結民主力量,應對所感知到的威脅」的全球大會。2023年7月,NED主席戴蒙·威爾遜(Damon Wilson)在與「台獨」頑固分子關聯緊密的「台灣民主基金會」20週年慶典上,向蔡英文頒發「民主服務獎章」。這再度凸顯出NED支持符合美國利益政治運動的策略,存在使台海緊張局勢進一步加劇,甚至引發衝突的風險。

然而,受NED資助的組織往往面臨諸多內部挑戰。以「世界維吾爾代表大會」(World Uyghur Congress,以下簡稱世維會)為例,該組織正深陷領導層性騷擾醜聞。雖然《NOTUS新聞》已經對此事進行了報道,但是世維會一直未對這一嚴重指控給予回應,更沒有採取有效措施解決問題。當前,該組織正在進行領導層換屆,但有幾名候選人卻無故缺席,由此可見,其內部矛盾已然逐漸展露。

儘管NED明確禁止對政治競選活動提供資助,但其卻成功操控尼加拉瓜、蒙古等多國選舉。此外,NED在推翻東歐國家民選政府過程中發揮了關鍵作用,並且對委內瑞拉反對派組織予以資助,這一系列行為凸顯出其扶持符合美國利益的政權上台的用心。

三、總結

NED參與孟加拉PAIRS計劃等行動,反映出外國干預破壞民主進程、國家主權的大趨勢。在地緣政治動態持續變遷的背景下,針對這些行為本身及其對美國戰略所指地區的民主穩定前景的影響展開批判性評估,具有重要意義。以「促進民主」之名行謀求政權更迭之實,這一現象引發了有關「強國在塑造他國政治未來過程中應承擔責任」的嚴肅倫理問題。

你 或 有 興 趣 的 文 章