又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队

关注并星标

从此不迷路

计算机视觉研究院

a0d2dff6d1265c1df05b493f70423356.gif

14063f8612dbe86d2f0cd57e955dabab.gif

283024c2678263ef55edfbecd9a13441.png

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

「他们并不是照抄文本,而是剽窃想法。」

转自《机器之心》

01

概述

昨天,有人在 reddit 上发帖称,IBM 苏黎世研究中心剽窃了自己的论文,而且还被 CVPR 2022 接收了。

这位发帖者写道:

我叫 Xianbiao Qi,是一位有十多年研究经验的计算机视觉研究者。我写这个博客是为了投诉一个严重的案例:IBM 苏黎世研究中心的员工蓄意剽窃我们的论文。他们并不是照抄文本,而是剽窃想法。

Qi 提到的疑似被抄袭的论文题为「PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML(平安 VCGroup 为 ICDAR 2021 科学文献解析竞赛任务 B 提供的解决方案:HTML 表格识别)」,作者来自平安保险和平安科技,上传 arXiv 的时间是 2021 年 5 月份,2021 年 7 月份公布了代码,2021 年 9 月发布了 Tablemaster 预训练模型,2021 年 11 月发布了 tablemaster_mmocr docker 环境。论文中提到的竞赛是 2021 年 4 月结束的,由 IBM 的另一个团队主办。

90866ab19db0d905a825dbe3b54c8057.png

论文链接:https://arxiv.org/pdf/2105.01848.pdf

如论文标题所述,这篇文章为 ICDAR 2021 科学文献解析竞赛任务 B(HTML 表格识别)提供了一套解决方案。具体来说,他们将表格内容识别分为四个子任务:表格结构识别、文本行检测、文本行识别和框分配。表格结构识别算法是基于一种鲁棒的图像文本识别算法 MASTER 定制的。PSENet 用于检测表图像中的每个文本行。文本行识别模型也建立在 MASTER 之上。最后,在框分配阶段,他们将 PSENet 检测到的文本框与通过表结构预测重构的结构项相关联,并将文本行的可识别内容填充到对应项中。

37fde1ef442533f909bc837146866d97.png

被指抄袭的 IBM 论文题为「TableFormer: Table Structure Understanding with Transformers(TableFormer:用 Transformer 理解表结构)」,上传 arXiv 的时间是 2022 年 3 月份,提交给 CVPR 的时间未知。

a5cf54c3f8308c23d7e1e8d79425bd31.png

论文链接:https://arxiv.org/pdf/2203.01017.pdf

180db6e94e7cbb7a83b92e8c0884ec8e.png

在这篇论文中,IBM 的研究人员提出了一种新的表结构识别模型,它从两个方面改进了最新的端到端深度学习模型(即来自 PubTabNet 的 encoder-dual-decoder)。首先,他们引入了一种新的目标检测解码器用于表格单元格。通过这种方式,他们可以直接从 PDF 源中获取编程式 PDF 的表格单元格内容,从而避免了定制 OCR 解码器的训练。这种架构上的改变带来了更精确的表格内容提取。其次,他们将 LSTM 解码器替换为基于 transformer 的解码器。

Qi 表示,IBM 的这篇论文剽窃了他们的方法论、预处理、后处理、可视效果、推理、系统级解决方案、代码、预训练模型等内容,但「为了不被抓住」,他们没有引用 Qi 等人的论文。

6c93938c29a0ad12156a75e597f3105f.png

接下来,Qi 用十几张图展示了他认为 IBM 存在抄袭的地方。

94feb34ce07039c3aa390cee5a74bfb1.png

Qi 展示的疑似抄袭点 1:方法论。他认为,IBM 的研究者抄袭了他们的想法,并重写了「贡献」部分,而且根据他们的图重新画了结构图。

95f52889142f213807886f650e59b4c3.png

Qi 展示的疑似抄袭点 2:预处理。

6bb133f2413d9f5098e075fb9e4ab327.png

Qi 展示的疑似抄袭点 3:后处理。

a388899a1578cf5b2d88df4cd312704d.png

Qi 展示的疑似抄袭点 4:推理加速方法

a02813ae74b2d00e13f2d619768eddc8.png

Qi 展示的疑似抄袭点 5:技巧。

dcf719d13709ea492ddd05581df36a9f.png

Qi 展示的疑似抄袭点 6:文本行检测和文本行识别。

8289492119c09996937c13d8ba113018.png

Qi 展示的疑似抄袭点 7:系统级解决方案。

f7a45af1a7d9a8999ce162cc7493dc0a.png

Qi 展示的疑似抄袭点 8:可视效果。

c8a9330d636118082ca57607d2b22c20.png

Qi 展示的疑似抄袭点 9:误导读者。

在看了 Qi 给出的示例后,有人认为这些都是非常有力的证据,IBM 团队很难证明自己的论文是原创的,Qi 应该向 CVPR 程序委员会投诉。

93c1f8af6edeb03341a9535fb1357b01.png

不过,也有人认为,这些证据不够有力:「两个小组研究的是同一个问题,使用的是相同的公开数据,他们的解决方案也有相似之处。但这并不意味着一方照搬另一方。例如「疑似抄袭点 1」中所展示的内容就不是那么接近」。

0a923dfaaef19674934860e91a46eff2.png

目前,我们还没有在帖子下方看到 IBM 论文作者的回应。

不过,值得一提的是,这并不是今年 CVPR 曝出的唯一一件疑似抄袭事件。几天前,一位网友在 YouTube 上爆料说,首尔大学的一篇论文抄袭了十几篇其他论文,目前该论文作者已经出来道歉并撤稿。

或许,顶会论文在查重上面需要多下点功夫了。

参考链接:https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/

© THE END 

转载请联系本公众号获得授权

34e542a2586c6c7dfd617f60a32a32d4.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

VX:2311123606

2168eb23f62fa802665fb723cbb000cf.png

往期推荐 

🔗

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值