北理工硕士生「一字不差」抄袭顶会投稿,网友:买论文被忽悠了?

点击“开发者技术前线”,选择“星标”

让一部分开发者看到未来

1878295aa402be98af3cabe39e30cef7.png

转自:机器之心

竟然如此明目张胆, 一字不差地抄袭NeurIPS 2020的论文投稿。

最近AI圈怪事连连,论文抄袭、学历造假事件不断。特别是论文抄袭,是学术圈屡禁不止的一种现象。

前段时间,一篇 ICML 2021 论文的作者举报某 ICCV 2021 接收论文的事件轰动整个社区。被三大视觉顶会ICCV接收的该篇论文也被撤稿。

ICCV抄袭事件刚过去不久,又有作者在知乎爆料某北理工硕士几乎一字不差地抄袭其论文并上传arXiv。

该话题在知乎上已经引发社区热议,热度高达 1057万,登上知乎科技热榜第一。

1498627092da36382abd8594066d512b.png

此次抄袭者与被抄袭者均为国内研究人员。

旷视研究员实锤北理工硕士抄袭


近日,旷视研究员王剑锋在知乎上发文,实锤北京理工大学和河海大学的三位作者共同上传arXiv的一篇论文抄袭他们的研究成果。

抄袭论文为近日上传arXiv的《 Label Assignment Distillation for Object Detection 》。
b28816b0ba6dadad35fa83cb2d5216f1.png

论文链接:https://arxiv.org/pdf/2109.07843.pdf

被抄袭论文则为王剑锋等人NeurIPS 2020 的投稿。王剑锋在文章中称:「我们的投稿,被泄露并被抄袭挪用了。」

831429515d5b83bcc9e6599640c61b77.png
王剑锋等人的投稿。

是不是标题完全一样?不仅如此,从论文对比中,我们可以看出两篇文章摘要几乎完全一致、图片完全一致、表格数据完全一致。

daff64a352e426ae729513ec55206632.png部分论文截图对比

王剑锋称,「(抄袭论文的)作者们主要修改了部分措辞,并采用了 CVPR 2021 的 latex 模板,这一过程完全是主观刻意的。我们要强调一点,arxiv 文章中没有任何一个配图、表格、公式是新的,完全没有做额外的实验。」

看来是实锤无疑了。

此外,被抄袭论文作者们深挖了抄袭者们的信息,发现一作高明豪是山东科技大学计算机科学与工程学院网络工程专业 2017 级本科生,现已毕业;共同一作是北京理工大学自动化学院智能信息处理与控制方向 2020 级硕士生张海伦;三作是河海大学常州校区物联网院计算机科学与技术专业 2017 级本科生晏艺格,现已毕业。

在整理完证据之后,王剑锋也向 NeurIPS 2020 组委会(质疑是否存在审稿人泄露、传播、挪用投稿的情况)、北京理工大学、河海大学做了初步投诉。

5ce4e51c81dca588fac082a818f904fe.png来自王剑锋知乎文章

在文章中,王剑锋也透露了与高明豪、张海伦沟通联系的结果,二人声称是「pdf 上传错误」、「初次涉猎相关事务」导致的结果。此外,他们的沟通也透露出该投稿之所以泄露是因为「审稿留下当学习资料。」

之后,王剑锋也收到了 NeurIPS 2020 组委会的官方回复,证明审稿人、领域主席、高级领域主席中没有人来自如上机构。另根据其他一些线索,他们初步也排除来自审稿流程中泄露的可能。


ed5e6c8b74fbcbe1c98d99d48d247ed0.png
来自王剑锋知乎文章

此外,他们也收到了北京理工大学的官方回复,北京理工大学自动化学院已经成立了工作小组调查此事。

网友:买论文被忽悠了?


抄袭事件被爆料后引起了社区极大的关注,截至发稿一直都是知乎科学热榜第一。

在整个事件中,大家最关注的是两件事:1.论文作者的态度;2.投稿文章是怎么泄露的?

关于抄袭论文作者们的态度,从王剑锋的知乎文章中大家就可以看出,当事人完全没有意识到这是严重的学术不端行为,而是以「pdf 上传错误」、「初次涉猎相关事务」作为借口。

那么投稿文章到底是怎么泄露的?
d56e3680e7d264b47f5ec14a53a99f63.png来自知乎回答:https://www.zhihu.com/question/487690998/answer/2129227928

有网友分析称碰到论文中介了,买到了被审稿的论文。因为三个作者不改标题、图片、数据,几乎一字不差地抄袭论文就挺奇怪的。

这类猜测也得到了大量网友的认同,也许三位作者真是买论文被忽悠了?

16fbdff5742ebb208f5f228cdcf319f2.png

   简介

免费电子书《Machine Learning Yearning》是吴恩达历时两年总结整理的一本机器学习实践经验宝典,它以较高的层次为我们介绍了许多在机器学习时代AI工程师应该掌握的技术策略。该书并不聚焦于具体的AI算法,而是为我们介绍了许多具有泛化性的如何让AI算法有效工作的技术。

这本书的重点并不是教你具体的机器学习算法,而是如何让机器学习算法有效工作。

   主要内容

部分内容如下:

  • 机器学习为什么需要策略?

  • 如何使用此书来帮助你的团队

  • 先修知识与符号说明

  • 规模驱动机器学习发展

  • 开发集和测试集的定义

  • 将大型开发集拆分为两个子集,专注其一

  • Eyeball 和 Blackbox 开发集该设置多大?

  • 小结:基础误差分析

  • 偏差和方差:误差的两大来源

  • 偏差和方差举例

  • 与最优错误率比较

  • 处理偏差和方差

  • 偏差和方差间的权衡

  • 减少可避免偏差的技术

  • 训练集误差分析

  • 减少方差的技术

  • 诊断偏差与方差:学习曲线

  • 绘制训练误差曲线

  • 流水线组件的选择:数据可用性

  • 流水线组件的选择:任务简单性

  • 建立超级英雄团队 - 让你的队友阅读这本书吧!

扫下发码关注 获取回复「MLY」即可获取

b2dd91c05db4b4734ef744485da2d2aa.png

回复「MLY」即可获取

Table of Contents (draft) Why Machine Learning Strategy 4 ........................................................................................... How to use this book to help your team 6 ................................................................................ Prerequisites and Notation 7 .................................................................................................... Scale drives machine learning progress 8 ................................................................................ Your development and test sets 11 ............................................................................................ Your dev and test sets should come from the same distribution 13 ........................................ How large do the dev/test sets need to be? 15 .......................................................................... Establish a single-number evaluation metric for your team to optimize 16 ........................... Optimizing and satisficing metrics 18 ..................................................................................... Having a dev set and metric speeds up iterations 20 ............................................................... When to change dev/test sets and metrics 21 .......................................................................... Takeaways: Setting up development and test sets 23 .............................................................. Build your first system quickly, then iterate 25 ........................................................................ Error analysis: Look at dev set examples to evaluate ideas 26 ................................................ Evaluate multiple ideas in parallel during error analysis 28 ................................................... If you have a large dev set, split it into two subsets, only one of which you look at 30 ........... How big should the Eyeball and Blackbox dev sets be? 32 ...................................................... Takeaways: Basic error analysis 34 .......................................................................................... Bias and Variance: The two big sources of error 36 ................................................................. Examples of Bias and Variance 38 ............................................................................................ Comparing to the optimal error rate 39 ................................................................................... Addressing Bias and Variance 41 .............................................................................................. Bias vs. Variance tradeoff 42 ..................................................................................................... Techniques for reducing avoidable bias 43 .............................................................................. Techniques for reducing Variance 44 ....................................................................................... Error analysis on the training set 46 ........................................................................................ Diagnosing bias and variance: Learning curves 48 ................................................................. Plotting training error 50 .......................................................................................................... Interpreting learning curves: High bias 51 ............................................................................... Interpreting learning curves: Other cases 53 .......................................................................... Plotting learning curves 55 ....................................................................................................... Why we compare to human-level performance 58 .................................................................. How to define human-level performance 60 ........................................................................... Surpassing human-level performance 61 ................................................................................ Why train and test on different distributions 63 ...................................................................... Page!2 Machine Learning Yearning-Draft V0.5 Andrew NgWhether to use all your data 65 ................................................................................................ Whether to include inconsistent data 67 .................................................................................. Weighting data 68 .................................................................................................................... Generalizing from the training set to the dev set 69 ................................................................ Addressing Bias and Variance 71 ............................................................................................. Addressing data mismatch 72 ................................................................................................... Artificial data synthesis 73 ........................................................................................................ The Optimization Verification test 76 ...................................................................................... General form of Optimization Verification test 78 ................................................................... Reinforcement learning example 79 ......................................................................................... The rise of end-to-end learning 82 ........................................................................................... More end-to-end learning examples 84 .................................................................................. Pros and cons of end-to-end learning 86 ................................................................................ Learned sub-components 88 .................................................................................................... Directly learning rich outputs 89 .............................................................................................. Error Analysis by Parts 93 ....................................................................................................... Beyond supervised learning: What’s next? 94 ......................................................................... Building a superhero team - Get your teammates to read this 96 ........................................... Big picture 98 ............................................................................................................................ Credits 99
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值