NCBI数据上传(一):扩增子测序数据

本篇文章把上传数据(扩增子测序)的步骤尽可能详细的整理出来,希望能对各位科研工作者有所帮助。其它类型数据上传讲解将依次在后续推文中奉上,大家持续关注哦!

1.注册及登录账号

1)注册一个NCBI(https://www.ncbi.nlm.nih.gov/)网页:按照提示填写账号、密码、邮箱等信息。

2)登录账号,点击左上角的NCBI大图标回到NCBI的主页,然后点击图中Submit按钮进入提交数据页面。

2.生成Biosample编号

1)进入Submit界面之后点击Make a selection的小三角,选择Biosample,点击GO。(提交数据前必须先把样品信息录入生成Biosample编号。

​2)在下一个界面中点击蓝色按钮New submission。

3)进入如下页面,根据实际情况填写提交者的信息:包括姓名,邮箱(需要填写一个以单位后缀邮箱),学校学院,单位地址,填写完成点击Continue。

​4)接下来填写数据释放的时间,可选择立即释放,也可选择指定日期;下一个选项选择batch/Multiple Biosamples,然后点击Continue即可。

5)接下来选择样品类型Sample Type,通常的微生物多样性样品选择第四个选项Metagenome or environmental sample,特殊的样品类型也可根据实际情况选择。然后点击最下方的Continue。

6)接下来填写样品信息Attributes,在线填写和上传excel文件都可,小编习惯下载他们的模板填写后上传的方式:点击第二个选项,然后Download Excel。

​7)打开该Excel,文件如下,以本次提交的3个样品为例,其中绿色的栏目为必填项,如果不知道具体信息就填写“not collected”,填的越详细NCBI审核的速度会越快,如果都填“not collected”也可以,不过NCBI反馈给你Biosample编号会慢一些,大约需要2-3天。

​8)上传之后就可以点击Continue进入下一个关卡了。值得注意的是,很多同学在点击Continue后会报错,网站提示有重复样品名称(但实际上表格里没有重复),这时候您需要在之前的excel表的最后一列再加一列replication,赋予每个样品不同的重复值即可,然后再次上传即可进入下一步。

9)接下来就是生成BioSample的最后一步,确认信息后点Submit即可。

​10)接下来要做的就是坐等NCBI的邮件,第一封邮件是点击Submit后自动发送的,可以忽略。我们需要等的邮件是包含Biosample编号的邮件,如下图所示。这封邮件里会详细说明您的每个样品跟Biosample accession号的对应关系,后续上传raw data需要用到。

​3.raw data上传

1)待收到BioSample编号之后,我们要再次登录NCBI,进入Submit界面,这次我们选择Sequence Read Archive(SRA),然后点击New submission进入最后的数据上传关卡。

2)同样的,第一步填写个人信息。

3)填写通用信息,这里我们没有注册Bioproject号,所以选择No(也可以单独申请Bioproject编号,小编认为那样操作有点繁琐)。Biosample这里要选择yes,Release date根据需要选择即可。点击Continue。

4) 接下来到了Bioproject阶段,根据实际项目内容填写项目的摘要,简单的几个词描述一下就可以了。后边的几个选项没有特殊情况的话第一个选择No,其他的不填即可。然后Continue。

5)跟Biosample差不多,也需要填写一个表格,在线填写和下载模板填写再上传一样的,小编以下载Excel表格填写为例。

​6)这个表格是这个样子的:biosample accession编号就是邮件里的编号,library_ID这里可以自行命名只要不重复即可。剩下的选项如图所示,通常情况是这样填写,在filename那里,请各位同学一定要保证跟后续要上传的文件名完全一致,并且不能有“,”、“-”等奇奇怪怪的符号,如果有可以改成下划线“_”或者删掉。

7)接下来就是最后一步了,上传数据。在这里,我们需要安装一个IBM的软件——Aspera Connect用于大数据传输(下载地址:https://downloads.asperasoft.com/en/downloads/8?list,下载安装即可,推荐使用360浏览器,与Aspera关联比较方便,如果实在不会使用可以留言或者加小编微信获取详细使用方法)。

8)选择图中第一个选项,在choose files选择你的所有文件,网站会自动使用Aspera帮您上传文件,速度很快。出现下图的界面就说明正在上传中了。

9)上传完成后点击Continue后会弹出一个确认界面,信息无误后,点击Submit即可完成上传。接下来就是等待NCBI的工作人员审核数据,绝大部分情况下是没有问题的,2天内会收到确认邮件,其中就包含编辑需要的数据登录号。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
细菌16S rRNA基因测序数据上传NCBI SRA数据库是非常重要的。SRA(Sequence Read Archive)是一个公共数据库,它存储了各种生物的DNA和RNA测序数据,包括细菌。下面我将解释为什么要将细菌16S rRNA基因测序数据上传NCBI SRA数据库。 首先,通过将16S rRNA基因测序数据上传NCBI SRA数据库,可以实现数据的共享和开放。科研人员可以从共享和获取数据,提高科学研究的效率和可信度。这种共享可以促进各种细菌基因组学研究的进展,并促使更多的研究人员参与进来。 其次,通过上传数据NCBI SRA数据库,可以提高数据的可靠性和复现性。对科研成果的复现是科学研究的基石,它可以验证实验结果的准确性和可信度。当同一份数据被共享并上传NCBI SRA数据库时,其他研究人员可以验证和重复原来的研究,从而增加了数据的可靠性。 此外,将细菌16S rRNA基因测序数据上传NCBI SRA数据库,也有利于相关研究的引用和参考。其他研究人员可以引用和参考已上传数据,从而推动整个领域的研究进程,提高科学研究的质量和影响力。 综上所述,细菌16S rRNA基因测序数据上传NCBI SRA数据库是为了实现数据的共享、提高数据的可靠性和复现性,以及促进相关研究的引用和参考。这将对于细菌基因组学研究的发展和推动具有积极的意义。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值