华为盘古抄袭时间线，全梳理！

大模型老炮

于 2025-07-09 11:38:29 发布

阅读量1.8k

点赞数 8

CC 4.0 BY-SA版权

文章标签：大模型人工智能 AI大模型语言模型多模态大模型大模型学习程序员

本文链接：https://blog.csdn.net/2401_85375151/article/details/149220353

关于华为盘古大模型被指抄袭阿里通义千问（Qwen）的争议，综合多方信息，核心进展与各方回应如下：

1. 抄袭指控的核心依据

参数相似度异常
匿名账号"HonestAGI"在GitHub发布技术报告，称通过"LLM-Fingerprint"技术分析发现，盘古Pro MoE 720B模型与阿里Qwen-2.5 14B的注意力参数分布相似度高达92.7%，远超行业正常差异范围（通常独立训练的模型相关性低于0.5）。报告推断盘古可能通过“增量训练+架构调整”修改自Qwen模型。
代码版权注释争议
华为开源代码中被发现包含"Copyright 2024 The Qwen team, Alibaba Group"的版权声明，引发对代码来源的质疑。
架构设计重合
技术分析显示，盘古模型保留了Qwen 1-2.5代特有的QKV偏置设计（多数新模型已弃用），早期层参数收敛模式高度一致。

2. 华为官方回应

华为诺亚方舟实验室（盘古开发团队）于7月5日发布声明，主要强调三点：

否认增量训练
盘古Pro MoE是基于昇腾硬件平台独立开发训练的基础大模型，并非基于其他厂商模型微调。
承认参考开源代码
部分基础组件参考业界开源实践（含其他大模型代码），但严格遵循开源协议（如Apache License 2.0）并标注版权声明，称此为行业通行做法。
强调技术创新
提出分组混合专家模型（MoGE）架构，称其为全球首个适配昇腾平台的同规格MoE模型，优化了分布式训练效率。

3. 争议焦点与疑点

技术指控的可靠性存疑
- HonestAGI账号背景可疑：无历史记录，论文署名作者查无此人，参考文献疑似伪造，发布后迅速删库。
- 华为用相同算法比对盘古与其他主流模型（如百川），均显示高相似性，质疑方法有效性。
开源合规性辨析
- 法律专家指出：使用Apache 2.0协议的开源代码（如Qwen的Transformers组件）并标注来源，不构成抄袭。
- 但若存在隐瞒原始署名或未授权增量训练，仍可能涉及侵权。
内部爆料与舆论分化
- 知乎匿名文章《盘古之殇》（下面提供了全文）指控华为内部存在"套壳派"（直接复用Qwen权重）与"自研派"斗争，后者因效率低被边缘化。
- 部分从业者认为：华为目标为验证昇腾硬件能力，复用成熟开源模型架构是合理策略，与英伟达做法类似。

4. 事件关键节点梳理

时间	事件
2025-07-04	HonestAGI 发布指控报告，指参数相似度 92.7% + 代码含 Qwen 版权声明
2025-07-05	华为回应：独立训练 + 合规使用开源 + 创新 MoGE 架构
2025-07-06	《盘古之殇》爆料内部技术路线分歧，称自研团队被压制

5. 结论

尚无抄袭铁证
当前技术分析存在方法论争议，HonestAGI身份真实性存疑，华为的代码引用符合开源规范。
自研程度待验证
华为是否如2023年所称"未用任何开源技术"（张平安发言）与当前"参考开源实践"的声明存在张力，需进一步技术验证。
产业竞争背景
事件折射国产大模型在硬件适配（昇腾vs英伟达）、数据合成能力、开源合规等层面的激烈博弈。

但我想说的，不是谁写小作文谁就有理，更不能代表正义。

另外，GitHub是代码托管平台。

如何学习AI大模型？

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】