當地時間5月13日10時,OpenAI首席技術官Mira Murati在全球矚目的春季發佈會上揭幕了新一代AI巨擘——GPT-4o。這款全能型AI模型以其超乎尋常的實時多模態對話能力,引發全球關注。
據《華爾街見聞》,GPT-4o的特性在於其高度的即時響應和表達能力,如同真實人類一般,能夠同時處理文字、圖像、視頻和語音信息,且接受和中斷對話自如。OpenAI創始人Sam Altman暗示了GPT-4o強大的擬人化能力,他在社交平台上引用了電影《Her》中的概念,預示人機交互或開啓新篇章。
Murati宣佈,相較於GPT-4 Turbo,GPT-4o速度提升了兩倍,開放API接口的同時,用戶請求速率上限提升至之前的五倍。
更為引人關注的是,這一先進模型將全面免費開放,惠及ChatGPT的所有用戶,取消其他所有限制,API價格降低50%。
發佈會還展示了桌面版ChatGPT及全新用戶界面(UI)。
GPT-4o即日起逐步向用戶開放,未來還將增加語音和視頻理解等功能。
Murati稱,GPT-4o為每個用戶都提供了GPT-4級別的智能,同時還改進了GPT-4在文本、視覺以及音頻方面的能力。
借助GPT-4o,OpenAI通過跨文本、視覺和音頻端到端訓練了新模型,使得所有輸入和輸出都由同一神經網絡處理,進一步降低了延遲。
據稱,GPT-4o的語音響應延遲已顯著降低,平均為320毫秒,接近人類對話的反應速度。
演示環節,Murati邀研究主管Mark Chen和後訓練團隊負責人Barret Zoph共同展示了GPT-4o的強大功能,包括解方程、解讀代碼、實時翻譯,甚至能通過視頻識別面部情緒。
1)看圖指導解方程
演示中,Zoph在白板上寫了一個方程式3x+1=4,ChatGPT給他提示,引導他完成每一步解答,識別他的書寫結果,幫助他解出了X的值。
2)解讀屏幕信息
Zoph將一段Python代碼輸入ChatGPT,並讓ChatGPT用一句話總結這段代碼在做什麼。GPT回答無誤,並詳細說明瞭數據是如何被處理的。
隨後,Zoph又運行了這段代碼,GPT能夠準確地描述出所生成圖表的具體含義,包括圖表主題、XY軸信息、峰值水平。
3)實時交替翻譯
GPT還在演示中扮演了翻譯員的角色。應社交媒體X的用戶請求,Murati現場對ChatGPT說起了意大利語,GPT則將她的話翻譯成英語,轉告Zoph和Chen;聽完Murati說的意大利語,GPT再將其翻譯為英文並告訴Chen:「Mark,她(Murati)想知道鯨魚會不會說話,它們會告訴我們什麼?」
4)通過視頻識別面部情緒
演示中,Zoph將手機舉到自己面前正對著臉,要求ChatGPT檢測他現在的情緒。最初,GPT參考了他之前分享的一張照片,將他識別為「木質表面」。經過第二次嘗試,GPT表示:「你看起來非常的開心,可能還有一點激動,看樣子你應該心情很不錯。」
Zoph贊揚了GPT的回答並表示自己正在進行一場演示,以展示「你有多不可思議」,此時GPT情緒頗為激動地表示:「快別說了!你讓我害羞了。」 這些演示彷彿證實了GPT-4o的特性,其「o」代表著「omni」,象徵著「全能」。
在後續的網絡實測視頻中,官方和用戶還探索出了GPT-4o的花樣玩法。
共享iPad屏幕後,讓GPT實時指導教學幾何題目。
正如Murati說,GPT-4o的發佈意味著OpenAI在大模型的易用性方面邁出了一大步,Ta正在改變人機交互的協作模式。
那麼,AI手機還會遠嗎?
此前有媒體報道透露,蘋果已經與OpenAI達成協議,將在全新操作系統iOS 18中引入ChatGPT技術,以升級Siri的對話體驗。
這不由令人猜想,GPT-4o和Siri將如何結合?OpenAI和蘋果會締造出具有跨時代意義的AI手機嗎?
英偉達高級研究科學家Jim Fan在X平台表示,iOS集成GPT技術可能會有三個層級:
1)放棄Siri。OpenAI為iOS提煉出更小型、純設備上的GPT-4o,並可選擇付費升級以使用雲。
2)將相機或屏幕傳輸到模型中的基礎功能。對神經音頻/視頻編解碼器的芯片級支持。
3)集成iOS系統操作API和智能家居API。Siri快捷方式是時候復活了。
有分析指出,蘋果和OpenAI的合作能夠解決彼此在發展邊緣AI方面的痛點,真正做到各取所需。
目前,有分析預測,蘋果將在6月10日的WWDC大會上官宣和OpenAI的合作夥伴關係,並推出基於蘋果LLM的AI聊天機器人。
令人激動的是,已經有移動端App開始接入GPT-4o了。
用於輔助盲人和弱勢群體日常生活的手機App Be My Eyes嘗試了接入GPT-4o,發現日常決策的效率被大大提高。
宣傳視頻顯示,一名盲人打開Be My Eyes後,能夠通過和GPT-4o對話,讓GPT詳細告訴他眼前的景象,從而快速做出決策。
有網友表示,這是GPT-4o的最佳用例,它將為視障人士創造一個全新的世界。
在所有演示結束後,Murati總結道:「正如大家所見,(如今的ChatGPT)真的很神奇。」
深喉
** 博客文章文責自負,不代表本公司立場 **