Skip to Content Facebook Feature Image

OpenAI發佈新AI模型o1 整體思考自我修正 答奧數題正確率超8成

大視野

OpenAI發佈新AI模型o1 整體思考自我修正 答奧數題正確率超8成
大視野

大視野

OpenAI發佈新AI模型o1 整體思考自我修正 答奧數題正確率超8成

2024年09月16日 11:20 最後更新:11:42

OpenAI 發表名為「o1」的最新AI模型,會運用更多時間思考,還能夠認識錯誤並修正答案,就像真人一樣。

新版旨在回答更複雜問題

綜合外媒報道,OpenAI推出新型人工智能模型o1-preview,是該公司計劃中「推理」模型系列的首款產品。o1模型旨在回答更複雜的問題,且速度快於人類。同時發布的還有較小型、更經濟實惠的o1-mini版本。

不再猜測改為整體盤算

新的模型名稱不僅重新回到「1」開始,而且也拿掉「GPT」,意味著 o1 和 GPT 系列採取了不同的策略,不再是靠統計預測的方式,去「猜」下一個字應該是什麼,而是會整體的考慮問題和答案的邏輯性。

數學考試答對問題83%

OpenAI研究主管特沃雷克 ( Jerry Tworek ) 表示,o1「使用了全新的優化演算法和特別為其量身打造的訓練數據集」。這種新方法使用強化學習技術,通過獎勵和懲罰來教導系統。故此它在數學和編程等方面表現更加出色。OpenAI目前的旗艦模型GPT-4o在國際數學奧林匹克競賽的資格考試中,僅能正確回答13%的問題,而o1的成功率高達83%。

OpenAI官網圖片

OpenAI官網圖片

「幻覺」減少但未完全解決

o1的另一個突破,是使用「思維鏈」來處理查詢,類似人類逐步解決問題的方式。特沃雷克指出,這種新的訓練方法使模型更加準確,「幻覺」問題有所減少,但仍未完全解決,因此最終還是要人類來做最後的檢查。

OpenAI官網截圖

OpenAI官網截圖

往下看更多文章

AI搶飯食?新創Basis「AI會計師」籌得近3億 工作能力相當於初級會計師

2024年12月21日 17:20 最後更新:18:38

國外一家AI新創公司籌得3400萬美元(約2.6億港幣),用於推廣Basis專為會計師事務所設計、能力相當於初級會計師的AI自動化產品。

自主代理AI系統進行複雜的工作

據外媒報導,總部位於紐約的新創公司Basis專注於自主代理AI系統,這類系統利用AI技術自主執行動作,特別適合進行複雜的工作流程。Basis的產品可自動處理交易輸入、資料檢查等任務,並與熱門帳簿系統如QuickBooks和Xero無縫整合。

觀看影片

產品功能相當於一名初級會計師

旗下有450名員工的會計事務所Wiss執行長哈普(Matt Harpe)表示,Basis產品的功能相當於一名初級會計師,會計人員無需再手動逐項查核,只需檢查AI會計代理的工作成果即可,讓Wiss這樣的大型會計師事務所的工作時間減少了大概30%。

unsplash設計圖片

unsplash設計圖片

可緩解人力資源壓力

目前,會計行業面臨嚴重人才短缺問題,尤其是在嬰兒潮世代退休、年輕一代對會計行業興趣減退的背景下。Khosla Ventures總經理拉博斯(Keith Rabois)指出,Basis的自動化技術可緩解人力資源壓力,讓現有會計師專注於高階審查工作。

會計被視為最容易受AI影響的行業之一

美國勞工統計局數據顯示,現在美國會計行業共有300萬名員工,但參加註冊會計師考試的人數自2016年來大幅下降了33%。報導稱,會計被視為最容易受AI影響的行業之一。OpenAI的研究指出,基於大型語言模型的自動化技術未來可能有能力涵蓋會計師與審計師的所有工作內容。

你 或 有 興 趣 的 文 章