OpenAI 發表名為「o1」的最新AI模型,會運用更多時間思考,還能夠認識錯誤並修正答案,就像真人一樣。
新版旨在回答更複雜問題
綜合外媒報道,OpenAI推出新型人工智能模型o1-preview,是該公司計劃中「推理」模型系列的首款產品。o1模型旨在回答更複雜的問題,且速度快於人類。同時發布的還有較小型、更經濟實惠的o1-mini版本。
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
— OpenAI (@OpenAI) September 12, 2024
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
不再猜測改為整體盤算
新的模型名稱不僅重新回到「1」開始,而且也拿掉「GPT」,意味著 o1 和 GPT 系列採取了不同的策略,不再是靠統計預測的方式,去「猜」下一個字應該是什麼,而是會整體的考慮問題和答案的邏輯性。
Some of our researchers behind OpenAI o1 🍓 pic.twitter.com/XnMx9vY2J2
— OpenAI (@OpenAI) September 12, 2024
數學考試答對問題83%
OpenAI研究主管特沃雷克 ( Jerry Tworek ) 表示,o1「使用了全新的優化演算法和特別為其量身打造的訓練數據集」。這種新方法使用強化學習技術,通過獎勵和懲罰來教導系統。故此它在數學和編程等方面表現更加出色。OpenAI目前的旗艦模型GPT-4o在國際數學奧林匹克競賽的資格考試中,僅能正確回答13%的問題,而o1的成功率高達83%。
「幻覺」減少但未完全解決
o1的另一個突破,是使用「思維鏈」來處理查詢,類似人類逐步解決問題的方式。特沃雷克指出,這種新的訓練方法使模型更加準確,「幻覺」問題有所減少,但仍未完全解決,因此最終還是要人類來做最後的檢查。