Llama3-V抄袭中国大模型?

Llama3-V开源项目实锤抄袭中国大模型

前言

QQ截图20240604141023.png

Llama3-V

最近斯坦福大学AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5一事引发了热议。面壁智能 CEO 李大海与联合创始人刘知远先后发文,回应开源模型被斯坦福大学 AI 团队抄袭一事,呼吁大家共建开放、合作、有信任的社区环境。

Llama3-V抄袭事件

QQ截图20240604135931.png

Aksh Garg部分致歉文章

5月29日,斯坦福大学的一个研究团队发布了一个名为“Llama3V”的模型,声称只要500美元就能训练出一个效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 的 SOTA 多模态模型。该模型发布的推特帖子浏览量很快就超过了30万,转发300+次,并迅速冲到了 Hugging Face 首页。 

然而,没过几天,推特与 Hugging Face 上就开始出现怀疑的声音,质疑 Llama3V 套壳了面壁智能在5月中旬发布的8B 多模态小模型 MiniCPM-Llama3-V 2.5,且没有在 Llama3V 的工作中表达任何“致敬”或“感谢”MiniCPM-Llama3-V 2.5 的声音。对此,Llama3V 团队回复称他们“只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer”,并宣称“在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作”。

可事情在后面迎来了反转,有网友在 Llama3V 的 Github 项目下抛出事实性质疑,但很快被 Llama3V 的团队删除。为此,提出质疑的网友被激怒暴走,跑到了 MiniCPM-V 的 Github 页面进行事件还原,提醒面壁智能团队关注此事。面壁团队通过测试发现,Llama3V 与 MiniCPM-Llama3-V 2.5很多地方有着100%的雷同,“不仅正确的地方一模一样,连错误的地方也一模一样”。

6月4日,面壁智能 CEO 李大海与联合创始人刘知远先后发文,回应开源模型被斯坦福大学 AI 团队抄袭一事,称“深表遗憾”。他们表示,一方面感慨这是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。“我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

事件最新进展为,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台上就这一学术不端行为向面壁 MiniCPM 团队正式道歉,并表示会将 Llama3-V 模型悉数撤下。

总结

此事件不仅引发了对学术诚信的广泛讨论,也让人们再次聚焦于AI领域中开源文化的重要性以及如何在鼓励创新的同时保护知识产权。

厚德云官方最近推出GPU狂欢月活动!高配4090折扣劲爆价!如果你对算力感兴趣或有需求,可以来厚德云官方看看!

厚德云是专业的AI算力云平台,为用户提供稳定、可靠、易用、省钱的GPU算力解决方案。海量GPU算力资源租用,就在厚德云。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值