Nature最新发文: 现在“论文工厂”造假有多严重?

Nature的最新报告显示,过去二十年间,至少有40万篇研究论文与论文工厂产出的文章相似,2022年占比高达1.5-2%,生物医学领域甚至达到3%。尽管存在误报风险,但识别论文工厂文章的文本相似性方法得到认可。郑老师团队提供科研统计课程和统计服务以应对这一问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

欢迎参加郑老师2023年孟德尔随机化课程即将开始

发表文章后退款!郑老师科研统计课程详情

Nature官网2023年11月6日的一篇报道,原文标题为“How big is science’s fake-paper problem?”,探讨了假论文的规模。

a4a51d9f2bb0b46842f7c9f7b29272e1.jpeg

Nature:生物医学论文,论文工厂比例3%

这一项《Nature》尚未正式发表的研究显示,过去二十年,有40多万篇研究论文与论文工厂产出的文章有很强的文本相似性;仅在2022年,就有7万篇这样的文章发表。该分析估计,在2022年发表的所有论文中,1.5-2%的论文像是论文工厂的文章;在生物和医学论文中,这一比例达到了3%

cab851890ca705d9beb32b745e185f51.jpeg

图. 近20多年来疑似论文工厂文章的占比

这项研究结果来自伦敦学术数据服务公司的主管Adam Day使用机器学习软件Papermill Alarm的一项分析。Day将软件设置为分析2000年以来4800多万篇论文的标题和摘要,并标记了与论文工厂文章(如已撤稿论文)相似的稿件。

文章指出,“论文工厂”的文章一些特点包括:

①遵循通用的模板
②与论文作者不对应的可疑电子邮件地址
③来自中国医院的电子邮件地址(因为这个问题在中国非常普遍)
④声称代表不同实验的相同图表
⑤表明努力避免抄袭检测的明显的措辞
⑥引用其他“论文工厂”的研究
⑦跨期刊重复提交

一位研究者称,Day使用的文本相似性法是目前识别论文工厂文章的最好方法,可以估计这类论文的普遍程度。但一些人表示,该方法可能会无意中捕捉被论文工厂复制内容的真实论文,或者存在作者将真实数据套入模板的情况。然而,Day表示,他将软件测试结果与已知真实论文或假论文的测试样本进行了验证,可以保持错误率“趋近零”。

Day还对OpenAlex数据库中记录了学科领域的285万项研究(均发表于2022年)进行了分析,其中约2.2%被标记为疑似论文工厂生产,具体比例因学科而异,其中医学和生物学领域中,该占比达到了3%

75130523cbb7dd0643f2de1acd052016.jpeg

图. 不同学科领域中疑似论文工厂文章的占比

Bik表示,Day的估计比例“高得惊人,但并非不可能”。她也表示,如果没看到Day的分析方法和全部细节,就无法充分评估他所做的工作。

出版伦理委员会2022年6月的一份报告称,对多数期刊来说,有2%的投稿可能来自论文工厂,有的甚至超过40%。该报告以六家出版商提供的私人数据为基础,未说明估算方法。

Nature杂志:每年发文评论造假现象

2021年3月23日,Nature 杂志曾起底论文工厂,将一篇题为《打击制造伪科学的 “论文工厂”》(The fight against fake-paper factories that churn out sham science)的长文报道挂在了官网头版头条。

8d414106a1129c09cd75d9abdf2b199b.jpeg

文章称,一些出版商发现了大规模的学术造假行为,且采取了多样化的应对措施以打击这种工业化的欺骗行为。

而在2022年,nature发文认为造假论文超过34万篇!

46861e1c5d566433938a8c6482346f13.jpeg

Nature的这一篇报道称,国际知名的文献检索数据库PubMed,被一款名为Papermill Alarm的软件工具查出可能存在超34万篇问题论文。该系统将引文数据库PubMed中列出的所有标题进行了查询,发现目前列出的论文中有1%的文本与论文工厂生产的文章非常相似。

中国学者撤稿比例奇高!

全球最大的撤稿数据库Retraction Watch网站记录了44000篇撤稿,其中与“论文工厂”相关的不到3000篇,该网站的创始人表示,这个数字被低估了,因为数据库维护人员仍在输入数千个撤稿信息,并且一些出版商在撤稿通知中避免使用“论文工厂”这个术语。

据统计,2022年,全球共有5488篇SCI被撤稿,而中国撤稿的数量多达2879篇,占总数的52%。

3e4dc01490913a4f4fd7554cafe72682.png

而导致中国论文被撤稿的主要原因质疑就是论文工厂!

e0bb50532b28b1016cfa9f188def3c9e.png

总之!一声叹息!

无论如何,“论文工厂”已经让出版商的系统不堪重负,论文造假很严重,生物医学领域是重灾区。

本公众提供各种科研服务了!

一、课程培训

2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10门课。如果您有需求,不妨点击查看:

发表文章后退款!2023年郑老师团队多门科研统计直播课程,欢迎报名

二、统计服务

为团队发展,我们将与各位朋友合作共赢,本团队将开展统计分析服务,帮忙进行临床科研。欢迎了解详情:

医学统计服务| 医公共数据库论文一对一指导

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值