6月4日消息,近日,一起涉及斯坦福大學AI研究團隊與清華系創業公司面壁智能的開源模型抄襲事件在網絡上引起了廣泛關注。據悉,斯坦福團隊發布的Llama3-V開源模型被指控抄襲了面壁智能的“小鋼炮”MiniCPM-Llama3-V 2.5模型。
事件的起因是,5月29日,斯坦福AI團隊在網上宣稱只需 500 美元就可訓練出一個超越 GPT-4V 的 SOTA 多模態大模型,然而,這一聲明并未持續太久,便有細心的網友發現,該團隊所發布的Llama3-V模型與面壁智能的MiniCPM模型在結構和代碼上存在著驚人的相似性,只是部分變量名有所不同。
據半導體新聞網了解,面壁智能團隊在6月2日深夜進一步證實了這一抄襲行為。他們發現,斯坦福的Llama3-V模型不僅能夠識別出“清華簡”中的戰國古文字,而且其錯誤的識別結果竟然與自家的MiniCPM模型如出一轍。這些用于驗證的古文字數據是面壁智能團隊歷經數月,從清華簡上逐字掃描并人工標注的珍貴資料,且從未對外公開。
面對這一嚴重的學術不端行為,斯坦福 Llama3-V 團隊的兩位作者 Siddharth Sharma 和 Aksh Garg 在社交平臺 X 上對面壁 MiniCPM 團隊就這一學術不端行為進行了正式道歉,并承諾將撤下所有 Llama3-V 模型。這并非他們首次為此事道歉,此前他們曾發布過一封類似內容的道歉信,但很快被刪除。