错误观点:凡是公开数据库下载的数据都可以重新分析和随意发表,不需要联系任何人!
正确做法:公开数据库收录的数据,可能存在陷阱,一定要仔细甄别,找到其原始作者的使用许可,加以确认是否存在所有权保护和利益冲突。
近日,上交大的研究者,使用SRA公开的基因组测序数据,进行重新分析,将其成果发表在Science Advances上,题目为A methylotrophic origin of methanogenesis and early divergence of anaerobic multicarbon alkane metabolism。几天后,数据拥有者蒙大拿州立大学的PI:Roland Hatzenpichler声明未提供使用许可,最后导致论文撤稿。
看到这里您是否有些迷惑,心中无数个???
“不是都公开了吗,怎么能不随便用?”
下面小编带你分析下原因,看看究竟是为什么:
首先,我们去Science Advances杂志上,看看这篇论文的原文,我们找到论文的“材料与方法”部分。
在“材料与方法部分”作者写道,使用了73个SRA数据集,见附表1。
然后我们下载附表1,找到蒙大拿州立大学的PI:RolandHatzenpichler。我们发现涉及到相关数据集4个:
我们去NCBI的SRA数据库看看究竟有什么问题。我们查询最后一个数据集SRR8554433:
会跳转NCBI 的bioproject,查看详细信息,我们发现数据集来自JGI:
我们点JGI,过去看看:
点下计划的名字,看看里面有什么:
点下帮助文档:
点开第一个,Finding your PI,你会发现一行文字:
文字中写道:
“如果您对私有数据的使用或者寻求发表许可,可以联系PI”
显然,作者并没有联系PI讨论任何发表的事情。
现在问题清楚了,总结一下:
第一,SRA的这四套数据来自JGI;
第二、JGI中标识并提示了“使用数据并发表需要联系PI”,但是SRA中没有任何相关文字和说明(只收录了数据,没附带太多说明);
第三、上交大的研究者从SRA获取数据,想当然认为可以随便使用、重新分析和发表,而没有看到JGI中的“发表需要联系PI”的文字(确实不太容易找,容易忽略);
第四、论文重新分析并发表后,数据所有者蒙大拿州立大学的PI: Roland Hatzenpichler表示不知情,通知杂志和作者;
第五、作者撤稿。
纵观事情的始末,我们应当注意,公开可下载的数据并不都是随便使用分析和发表的,有些需要数据拥有者许可(需要尊重数据生产者的劳动),希望以后使用公开数据进行分析和发表的朋友们多加注意,避免不必要的麻烦。
最后祝大家顺利,有问题留言!
往期精品(点击图片直达文字对应教程)
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集
(请备注姓名-学校/企业-职务等)