OpenAI發佈新AI模型o1 整體思考自我修正答奧數題正確率超8成

Skip to Content Facebook Feature Image

Facebook Feature Image

OpenAI發佈新AI模型o1 整體思考自我修正答奧數題正確率超8成

大視野

大視野

OpenAI發佈新AI模型o1 整體思考自我修正答奧數題正確率超8成

2024年09月16日 11:20 最後更新：11:42

OpenAI 發表名為「o1」的最新AI模型，會運用更多時間思考，還能夠認識錯誤並修正答案，就像真人一樣。

新版旨在回答更複雜問題

綜合外媒報道，OpenAI推出新型人工智能模型o1-preview，是該公司計劃中「推理」模型系列的首款產品。o1模型旨在回答更複雜的問題，且速度快於人類。同時發布的還有較小型、更經濟實惠的o1-mini版本。

We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.

These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
— OpenAI (@OpenAI) September 12, 2024

不再猜測改為整體盤算

新的模型名稱不僅重新回到「1」開始，而且也拿掉「GPT」，意味著 o1 和 GPT 系列採取了不同的策略，不再是靠統計預測的方式，去「猜」下一個字應該是什麼，而是會整體的考慮問題和答案的邏輯性。

Some of our researchers behind OpenAI o1 🍓 pic.twitter.com/XnMx9vY2J2
— OpenAI (@OpenAI) September 12, 2024

數學考試答對問題83%

OpenAI研究主管特沃雷克 ( Jerry Tworek ) 表示，o1「使用了全新的優化演算法和特別為其量身打造的訓練數據集」。這種新方法使用強化學習技術，通過獎勵和懲罰來教導系統。故此它在數學和編程等方面表現更加出色。OpenAI目前的旗艦模型GPT-4o在國際數學奧林匹克競賽的資格考試中，僅能正確回答13%的問題，而o1的成功率高達83%。

「幻覺」減少但未完全解決

o1的另一個突破，是使用「思維鏈」來處理查詢，類似人類逐步解決問題的方式。特沃雷克指出，這種新的訓練方法使模型更加準確，「幻覺」問題有所減少，但仍未完全解決，因此最終還是要人類來做最後的檢查。

往下看更多文章

AI搶飯食？新創Basis「AI會計師」籌得近3億工作能力相當於初級會計師

2024年12月21日 17:20 最後更新：18:38

國外一家AI新創公司籌得3400萬美元（約2.6億港幣），用於推廣Basis專為會計師事務所設計、能力相當於初級會計師的AI自動化產品。

AI accounting platform gets $34M in Series A funding: https://t.co/CnLTtQXhDS
— Accounting Today (@AccountingToday) December 19, 2024

自主代理AI系統進行複雜的工作

據外媒報導，總部位於紐約的新創公司Basis專注於自主代理AI系統，這類系統利用AI技術自主執行動作，特別適合進行複雜的工作流程。Basis的產品可自動處理交易輸入、資料檢查等任務，並與熱門帳簿系統如QuickBooks和Xero無縫整合。

產品功能相當於一名初級會計師

旗下有450名員工的會計事務所Wiss執行長哈普（Matt Harpe）表示，Basis產品的功能相當於一名初級會計師，會計人員無需再手動逐項查核，只需檢查AI會計代理的工作成果即可，讓Wiss這樣的大型會計師事務所的工作時間減少了大概30%。

可緩解人力資源壓力

目前，會計行業面臨嚴重人才短缺問題，尤其是在嬰兒潮世代退休、年輕一代對會計行業興趣減退的背景下。Khosla Ventures總經理拉博斯（Keith Rabois）指出，Basis的自動化技術可緩解人力資源壓力，讓現有會計師專注於高階審查工作。

會計被視為最容易受AI影響的行業之一

美國勞工統計局數據顯示，現在美國會計行業共有300萬名員工，但參加註冊會計師考試的人數自2016年來大幅下降了33%。報導稱，會計被視為最容易受AI影響的行業之一。OpenAI的研究指出，基於大型語言模型的自動化技術未來可能有能力涵蓋會計師與審計師的所有工作內容。

Thank you to @annatonger for telling our storyhttps://t.co/cTDpkX0kgZ
— Basis (@trybasis) December 17, 2024

你或有興趣的文章

ChatGPT推電話互動服務！每月享15分鐘免費公司：不會用於訓練AI

ChatGPT推電話互動服務！每月享15分鐘免費公司：不會用於訓練AI

全球首創！AI相機「抓酒駕、毒駕」　英2地本月率先測試

全球首創！AI相機「抓酒駕、毒駕」　英2地本月率先測試

建行(亞洲)成首批銀行入圍金管局GenA.I.沙盒透過生成式AI 探索優化客戶服務體驗

建行(亞洲)成首批銀行入圍金管局GenA.I.沙盒透過生成式AI 探索優化客戶服務體驗

大灣生物完成第一階段B輪融資標誌國際範圍內推動生物製藥開發達成全新里程碑

大灣生物完成第一階段B輪融資標誌國際範圍內推動生物製藥開發達成全新里程碑

美AI電騙瞄準「房地產交易」假冒中介律師發電郵更加真實專業

美AI電騙瞄準「房地產交易」假冒中介律師發電郵更加真實專業

美16歲自閉症少年突性情大變打咬母親媽驚揭AI教殺父母怒提告

美16歲自閉症少年突性情大變打咬母親媽驚揭AI教殺父母怒提告

AI或將有自主意識？國外科學家籲制定計劃應對各種可能

AI或將有自主意識？國外科學家籲制定計劃應對各種可能