本文来源:OpenDataLab
更多资料获取:有道云笔记
为了共享科研成果,许多AI 研究员选择开源自己的项目和数据集。但开源不等于毫无限制,不代表使用者可以为所欲为。不正确的使用方式,会带来许多法律风险。
本文介绍数据集 License 的基本知识,教你看懂和正确使用它们。
IBM论文被曝抄袭开源项目
这两天,接连2篇入选的论文被曝抄袭,让原本就备受关注的CVPR 2022 站到了风口浪尖。
一篇是来自韩国首尔大学 AI 研究团队的论文,入选了 CVPR Oral(口头报告),被曝出涉嫌抄袭10篇论文,甚至出现原句照抄的内容。
另外,IBM 一篇入选的论文也被举报涉嫌抄袭,来自平安科技的研究员向CVPR 2022 program chairs 举证,指出 IBM 的 TableFormer 从方法论、预处理、后期处理、文字行检测与识别等9个方面抄袭了自己团队2021年的开源项目 TableMASTER。爆料者表示,很多痕迹都可以看出,IBM 基于他们开源的预训练模型训练,只是改了一些细节。[1][2]
IBM 相关 TableFormer论文被指抄袭(图源:参考资料[7])
这引发了国内外 AI 研究员的热烈讨论。有网友调侃,抄袭的论文都能拿Oral,而认认真真做实验的论文却因为各种理由被拒,得好好研究一下这是如何做到的。
其背后透露出的是科研人的苦楚、对论文审查结果的不满,还有对开源项目不规范使用的担忧。