網傳史丹佛大學AI團隊抄襲、「套殼」中國國産大模型成果,引起業界高度關注和熱議。目前,涉事的史丹佛學生已公開正式道歉。
史丹福大學的一個研究團隊在5月29日發布Llama3-V項目,宣稱僅需500美元就能訓練出一個SOTA(State of the Art,即最先進的)多模態大模型,效果比肩GPT-4V、Gemini Ultra、Claude Opus等,但模型小100倍。
公開信息顯示,Llama3-V團隊的其中兩位作者 Siddharth Sharma 與 Aksh Garg 是史丹福大學計算機系的本科生,曾發表過數篇機器學習相關的論文。
名校背景,特斯拉、SpaceX等大廠經歷的成員,再加上號稱足以「改變現狀」的研究成果,Llama3-V受到了相當程度的關注。Llama3-V不僅在社交媒體上迅速躥紅,還一度沖上了HuggingFace趨勢榜(機器學習領域中較有影響力的平台,其趨勢榜一定程度反映出模型的流行度)的首頁。
然而,沒過幾天,一位網民發現,Llama3-V的模型結構和代碼與出自清華系明星創業公司面壁智能的MiniCPM-Llama3-V 2.5幾乎一模一樣,只是變量名有所變化。
網民在面壁智能GitHub的項目下放出了證據。這些證據包括:Llama3-V的模型架構和代碼與MiniCPM-Llama3-V 2.5幾乎完全相同,僅有一些變量名和格式化的差异;Llama3-V使用了MiniCPM-Llama3-V 2.5的分詞器(tokenizer),並且連同MiniCPM-Llama3-V 2.5定義的特殊符號也出現在了Llama3-V中;將從HuggingFace下載的Llama3-V模型權重中的變量名改成MiniCPM-Llama3-V 2.5的,模型可以用MiniCPM-V代碼成功運行。
兩個模型的代碼對比
網民為什麽不直接質疑Llama3-V,而是在面壁智能GitHub的項目下進行爆料?事實上,網民此前於6月2日在Llama3-V頁面上提出的質疑,不過很快便被Llama3-V的作者已經删除了。
為此,提出質疑的網民被激怒暴走,跑到了 MiniCPM-V 的 Github 頁面進行事件還原,提醒面壁智能團隊關注此事。
在MiniCPM-Llama3-V 2.5團隊收到提醒後也迅速作出反應,於是一個新的證據出現。
面壁智能的MiniCPM-Llama3-V 2.5項目具有獨特的功能,如識別清華簡——一種罕見的中國古代文字。
公開資料顯示,清華簡是清華大學於2008年7月收藏的一批戰國竹簡,為戰國中晚期文物。MiniCPM-Llama3-V 2.5團隊透露,識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能,訓練圖像是最近從出土文物中掃描並由MiniCPM-Llama3-V 2.5團隊標注,且尚未公開發布。
識別結果對比
Llama3-V模型居然也可以識別「清華簡」。兩個模型在識別的表現上,正確的結果上基本一致,錯誤的情况也頗為相似。
鑒於這些結果,MiniCPM-Llama3-V 2.5團隊表示,很難用巧合來解釋這種不尋常的相似性,希望Llama3-V的作者能够對這個問題給出官方解釋。相信這對開源社區的共同利益很重要。
當網民拋出三大事實質疑後,Llama3-V的做法是——不回應直接删除網民評論。
目前,Llama3-V 的 GitHub 項目主頁已顯示為「404」,HuggingFace上Llama3-V項目也已經不可見,在作者社交媒體賬號上也找不到此前宣傳 Llama3-V 的內容。
目前Llama3-V項目已經從開源網站中下架删除。
6月3日,Llama3-V團隊成員Aksh Garg在社交媒體上發文回應了質疑。但隨後不久這條回應便被删除。
Llama3-V在未公開的實驗性特徵上與MiniCPM-Llama3-V 2.5表現出高度相似的行為,這些特徵是根據MiniCPM-Llama3-V 2.5團隊內部數據訓練的。
面對抄襲的質疑,史丹福團隊最初辯稱,他們的工作早於面壁智能的MiniCPM,只是使用了他們的tokenizer。
另據媒體消息,面壁智能聯合創始人兼CEO李大海在朋友圈回應說「深表遺憾」,這也是一種「受到國際團隊認可的方式」,並呼籲大家共建開放、合作、有信任的社區環境。
面壁智能聯合創始人兼CEO李大海在朋友圈的回應。
面壁智能首席科學家、清華大學長聘副教授劉知遠表示,人工智能的飛速發展離不開全球算法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCPM-Llama3-V 2.5 就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞了這一點。他們在受到質疑後已在Huggingface删庫,該團隊三人中的兩位也只是史丹福大學本科生,未來還有很長的路,如果知錯能改,善莫大焉。
北京面壁智能科技有限責任公司成立於2022年8月,今年4月,面壁智能完成新一輪數億元融資,由華為哈勃領投,春華創投、北京市人工智能産業投資基金等跟投,知乎作為戰略股東持續跟投支持。今年2月,面壁智能發布開源模型MiniCPM後,又推出MiniCPM 2系列端側模型。李大海表示,推動大模型在端側的落地是面壁目前的重點工作之一。
據第一財經報道,在最新的進展中,史丹福Llama3-V團隊的兩位作者Siddharth Sharma和 Aksh Garg在社交平台上就這一學術不端行為向面壁MiniCPM團隊正式道歉,並表示會將Llama3-V模型悉數撤下。
Christopher David Manning發文譴責。
另外,史丹福人工智能實驗室主任Christopher David Manning也發文譴責這一抄襲行為,並對MiniCPM這一中國開源模型表示贊揚。
Manning寫道,「怎能不為自己的錯誤買單!清華大學自然語言處理實驗室做出了很棒的開源工作,有力推動科學發展。」
Manning還痛斥道:「所謂『真正做到之前,假裝你做到了』是矽谷的無耻産物。」Manning引用的這句流行語「Fake it before you make it」,一度盛行於矽谷的初創圈和科技公司,被不少創業者奉為圭臬。
毛拍手
** 博客文章文責自負,不代表本公司立場 **
每當聽到「倒車,請注意!」的提示聲,人們總會立刻聯想到那台靈活的「三蹦子」。「三蹦子」是國內常見的一種小型低速電動三輪車,通常用於短途運輸,因其靈活性和經濟性而受到歡迎,特別是在城市或鄉村的日常生活中。但是,在美國賣「三蹦子」,可以做成千萬美元的生意嗎?
「三蹦子」在海外社交平台意外走紅,讓25歲的駱豪看到了商機。一句「倒車請注意」的提示音,不僅吸引老外駐足圍觀,也為這個在美國加州創業不到一年的年輕人帶來了幾百萬元人民幣的營收。
創業首日進賬1萬美元的視頻火了,駱豪在美國賣「三蹦子」的故事也被家人知曉。內地《每日經濟新聞》近期通過視頻連線,見到了這位出海創業的「95後」小伙。
從金融專業海外留學到創業賣「三蹦子」,駱豪從沒想到會以這樣的方式賺取人生的第一桶金。在別人眼中,他的創業之路一帆風順,但他明白,美國市場之所以有需求是基於產品的實用性與性價比,而要讓美國市場成為成熟市場還有很長的路要走。
雖然銷售行情向好,但「『三蹦子』在美國被制裁」「上路是否合規」的聲音也接踵而來。駱豪強調,此前被加徵關稅的是高爾夫球車,「三蹦子」在美國還是一個新品類,他希望可以帶著自己的品牌,將「三蹦子」開進更多的美國農場。為此,他每天都在思考如何在美國更快地普及「三蹦子」。
從短視頻中發現商機
歐洲人的鬆弛感讓駱豪意識到,年輕人打拼事業不能在太過安逸的地方。於是,英國留學畢業後,他飛到美國紐約,一邊在餐館打工一邊尋找創業機會。
起初,駱豪在獨立站銷售跨境商品,無意間,他在短視頻平台看到美國人竟對「三蹦子」有著濃厚興趣,於是決定找國內的朋友訂購產品賣到美國市場。這期間,他開始尋找目標客戶,但打一百個電話只能加上七八個聯繫方式,而真正達成交易的更是「百裡挑一」。
經過一個多月的籌備與等待,今年1月,第一批「三蹦子」運達了駱豪在美國租用的倉庫,運過來的散件光卸貨就用了12個小時,他和幾個朋友從下午三點乾到第二天凌晨三點,現在回憶起來仍然印象深刻。
銷售第一天,前期談妥的三個客戶以每輛三千美元左右的價格買走了車。而在國內,每輛「三蹦子」的零售價也不過四千多元人民幣。
美國客戶在駕駛「三蹦子」。圖片來源:受訪者供圖
儘管首日銷售上萬美元成績喜人,但初嘗品類紅利的駱豪卻發現,資金壓力是他開啓事業的第一個難題。
「今年4月份之前,第一批貨就賣完了,但除去所有的成本開支,幾乎是身無分文,當時兩個合伙人沒有選擇繼續,於是我陷入了沒有資金、沒有團隊的境況中。」儘管如此,駱豪依然相信「三蹦子」在美國是有市場的,「真正的創業在4月之後從零開始,我自己去找資源、找供應鏈、找合伙人,在5月初找到了數百萬元的投資。」
投資人與駱豪見面聊了一次之後,第二天就把款打到了他的銀行賬戶上。他描述說:「很快,非常快,我從來沒有經歷過這麼快的事情。」
資金到位後,新組建的團隊趕忙將訂購下一批貨的計劃提上日程。如今,駱豪的創業公司已擴展到6個人。
擁有穩定的供貨商之後,今年5月,一位美國加州的蘑菇農場主向駱豪訂購了兩輛「三蹦子」。在「三蹦子」出現之前,這位農場主是靠皮卡將蘑菇運到加工廠,一輛皮卡的價格在4萬—5萬美元,差不多可以買10輛「三蹦子」。
主要客群為農場主、地攤商販
「『三蹦子』在美國的需求究竟如何?」記者問。
「直到今天,我們慢慢驗證出『三蹦子』在美國的確有用武之地。」駱豪告訴記者,「三蹦子」在美國對標的一種車型是全地形越野車(UTV),價格相對皮卡便宜一些,但一輛也要一兩萬美元,可以在農場里拉貨、在山上巡邏或者在社區公園運送垃圾,而這些功能「三蹦子」都具備,因此,性價比更高的「三蹦子」也在農牧場主和地攤商的群體中被廣泛接受。
如今,越來越多的墨西哥人開始在美國用「三蹦子」來擺地攤,這一類需求佔到駱豪當前客戶結構的二分之一。考慮到資金週轉與當地的用工、物流成本,他現在選擇整車進口,一次性採購二三十輛「三蹦子」,讓客戶自行來倉庫提貨。
「三蹦子」在美國也有很強的工具車屬性。圖片來源:受訪者供圖
「第五批貨也賣完了。」半年過去,駱豪已經賣出了100台「三蹦子」。他常常被問到如何把國貨賣到海外去,而關於這一點自己也在摸索。現在,駱豪依然會去加州各地做地推。他建議,做推廣最好還是招聘美國當地人,約定時間面對面拜訪更有可能達成交易。
駱豪表示,經過實踐,線上社交平台的推廣效果更佳。他聘請了當地的合伙人進行線上互動,與客戶建立聯繫,還有專門的維修服務人員做售後服務。
「也有遇到過因為喜歡我們的產品,驅車三四個小時來倉庫提貨的客戶。他試了一圈之後,馬上就下單了。」駱豪說每當這時都能激發整個團隊的信心,在加州本地從溝通到交付可以在當日完成,但大多時候他需要在線下推廣時一遍又一遍向感興趣的客人介紹車的功能、使用場景,具體到哪個按鈕控制哪個部件。
儘管客戶復購的情況尚未出現,但熟客介紹的訂單正在變多。「有顧客買了我們的產品後想要來做銷售,把產品推廣到他的朋友中去,或是在其他州有一些代理採購了小批量的貨準備試銷。」駱豪認為,客戶帶客戶的銷售方式最有效,「三蹦子」的復購頻率很低,使用壽命一般在五六年,因此商業模式側重擴展新客群,而非挖掘存量客戶。
《每日經濟新聞》記者注意到,在今年第三季度A股上市公司的業績說明會上,就有投資者關注到海外博主分享了不少宗申「三蹦子」。對此宗申動力管理層表示,公司全資子公司在越南設有製造基地,參股子公司在墨西哥設有製造基地,產品主要出口歐美、中東、東南亞、非洲、澳洲等國家和地區。
駱豪也開玩笑說,等上規模後要去墨西哥建廠,但當下的一個難題是如何讓更多美國人知道「三蹦子」的實用價值。
從零售商轉型批發商,擴品類是第一步
「你覺得還需要多長時間可以達到自己理想的市場滲透率?」記者問。
當貨源、資金、物流的問題解決後,駱豪預計至少還需要一年時間。由於從加州到紐約的物流成本遠高於產品成本,他暫時放棄佈局全美市場,先專注於在加州的推廣和銷售,待建立標桿後再考慮擴張計劃。
事實上,國內品牌商與生產商也在「秣馬厲兵」。被華人博主帶火的國威「三蹦子」收到了美國本土消費者從各跨境電商平台發來的訂單,國產「三蹦子」甚至開到了紐約時代廣場,在車流中穿梭自如。
駱豪也一直在觀察、研究車輛合規性方面的問題。他坦言,由於客戶購買後僅用於自家農場或短途載貨,至少目前還沒有涉及交規方面的問題。
「有一次來了一個比較特殊的顧客,是一位六七十歲的女士,她在美國開『三蹦子』已經超過十年了,相比大皮卡她更喜歡小一點的車。」駱豪回憶道,據她所說,在長期道路行駛的經歷中,從來沒有被警察攔下過,只有警察對她說:這是在哪裡買的,從來沒有看到過,看起來非常酷。那天她從很遠的地方開到駱豪的倉庫,打算買一輛新的「三蹦子」。駱豪說,據他了解,「三蹦子」的最大時速不超過40公里。
美國客戶在駕駛「三蹦子」。圖片來源:受訪者供圖
駱豪希望公司能從零售商向批發商的角色轉變,要實現這一過渡還需要很多條件。「在美國做批發,會面臨兩個問題:一是要讓客戶立等可取,那就需要足夠的資金去囤貨;二是倉庫要有支持大批量囤貨的面積,就得支付更多的租金。」這對駱豪而言仍是考驗。
於是,擴品類經營成為轉型路上的第一步。從「三蹦子」到電動滑板、電動自行車,駱豪手中的產品版圖正在擴大。他認為,通過銷售有認知基礎的成熟品類,可以以較少的推廣成本獲取客戶,儘管高頻次消費品的使用者不完全符合「三蹦子」的目標客戶,但可以幫助團隊積累銷售經驗,提升溝通技巧,了解當地購物習慣。
駱豪的產品品類已經擴展至電動滑板等。圖片來源:受訪者供圖
從目前公司營收結構來看,「三蹦子」因客單價較高仍然佔比最大。駱豪說,未來有機會觸達千萬美元的規模,但不排除會發生其他不確定性。他談到了今年6月「三蹦子」在美被加徵關稅的傳言:「我需要澄清一下,此前政策不是針對『三蹦子』,而是以高爾夫車為首的一類電動車,目前對『三蹦子』的實際影響並不大。但新總統上任後,一旦關稅措施延伸至所有品類,將直接影響企業財務狀況,企業不可能虧本銷售。作為創業公司,我們要先求生存再求發展。」
「我一直在想,怎麼把這個商業模式做大,讓大家知道這是能夠給他們提供價值的產品。」駱豪的生意正處於「從0到1」的初級階段,而這個模式的可行性仍在驗證中。