小米創辦人雷軍近日傳出耗資千萬(人民幣,下同)挖角來自北大的AI天才少女羅福莉,將其延攬進入小米AI大模型團隊。據悉羅福莉是國產大模型DeepSeek「DeepSeek-V2」的關鍵開發者之一。
尋求在大模型業務中平衡成本
《極目新聞》報導,雷軍在公開演講時曾表示,小米做大模型的思路和很多公司不太一樣,選擇主力突破的是輕量化和本地部署。對於小米這樣無論在手機還是造車上都講究「性價比」的公司而言,如何在燒錢的大模型業務中平衡成本,無疑是雷軍考慮的核心問題。而這,或許也是擁有DeepSeek-V2研發背景的羅福莉被雷軍看中的原因。
北大碩士畢業 曾於AI領域頂級國際會議發表8篇論文
公開資訊顯示,羅福莉是四川人,95後,本科就讀於北京師範大學電腦專業,碩士畢業於北京大學計算語言學專業。她在2019年還在就讀北大讀碩士期間便於AI領域頂級國際會議ACL上發表8篇論文,一戰成名,被封為AI天才少女。
當時,羅福莉回應稱,「投稿ACL是我近一年的產出,所以我認為自己是付出了足夠的努力,當然也可能也有運氣成分加持。」
曾於阿里達摩院進行AI研究
羅福莉研究所畢業後,先進入阿里達摩院做AI研究,從事預訓練語言模型相關的工作,負責阿里達摩院AliceMind開源項目,主導開發多語言預訓練模型VECO。
直至2022年,羅福莉加入幻方量化從事深度學習相關策略建模和算法研究,後跳槽至DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。
指DeepSeek-V2模型屬性價比之王
羅福莉今年5月DeepSeek-V2發表後撰文稱,「單論DeepSeek-V2模型的中文水平,是真實處在國內外閉源模型的第一梯隊...外加1元/百萬輸入Tokens的價格,只有GPT4價格的1/100,性價比之王。」