最新 NCBI 上传测序数据教程 (图文详解)

在做完测序后,一般期刊会要求提供公共数据ID,可以上传的数据库可以是 NCBI,EBI,DDBJ,以及国内的 NGDC。今天我们以 NCBI 上传数据为例。

0、基础知识

NCBI 的其中一个数据库 GEO 用于管理和存储我们的测序数据。GEO 构建之初用于存放芯片数据,后来成为随着测序技术的快速发展,逐渐成为高通量测序数据的主要存储库之一。

其中每个项目都可以包含有测序后原始数据信息,如 sra,fastq 等文件信息等,以及上游分析后的数据,如count,bam,bw 等文件。

需要注意的是上面提到的原始数据是存储的文件信息,真正的 raw data 文件是由 Sequence Read Archive (SRA) 库来管理。接下来的工作就是去 SRA 上传我们的数据。

1、登录或注册用户

网址:https://www.ncbi.nlm.nih.gov/account/
img

2、进入SRA

网址:https://submit.ncbi.nlm.nih.gov/

向下滚动,找到Sequence Read Archive (SRA)工具,点击Submit
img

2、新建提交

img

3、按要求填写信息

这一步需要的信息比较多,建议下载表格后,直接上传即可。

img

4、使用ascp

可以使用 ftp 上传,但 NCBI 提供了更为快速的上传工具 aspera ,这里实测是在 100 Mb/s 左右浮动,安装参考:https://blog.csdn.net/u011262253/article/details/107190684

希望在不久的将来,我们国家 NGDC 的 GSA 数据库也能有类似的工具,而不是只提供 ftp 上传。

ascp -i /mnt/h/work/aspera.openssh -QT -l100m -k1 -d /mnt/h/work/ncbi_upload/raw/ subasp@upload.ncbi.nlm.nih.gov:uploads/your_email_id

img

5、等待上传完成

img

6、确认是否上传完成

重复以上命令,ascp 会检测文件上传是否完整,如果上传完成,会直接 skipped
img

7、检测上传数据是否正确

img

确认无误后,确定公开时间等信息,等待审核通过后,会获得官方提供的唯一 GSE 标识符。

细菌16S rRNA基因测序数据上传NCBI SRA数据库是非常重要的。SRA(Sequence Read Archive)是一个公共数据库,它存储了各种生物的DNA和RNA测序数据,包括细菌。下面我将解释为什么要将细菌16S rRNA基因测序数据上传NCBI SRA数据库。 首先,通过将16S rRNA基因测序数据上传NCBI SRA数据库,可以实现数据的共享和开放。科研人员可以从中共享和获取数据,提高科学研究的效率和可信度。这种共享可以促进各种细菌基因组学研究的进展,并促使更多的研究人员参与进来。 其次,通过上传数据NCBI SRA数据库,可以提高数据的可靠性和复现性。对科研成果的复现是科学研究的基石,它可以验证实验结果的准确性和可信度。当同一份数据被共享并上传NCBI SRA数据库时,其他研究人员可以验证和重复原来的研究,从而增加了数据的可靠性。 此外,将细菌16S rRNA基因测序数据上传NCBI SRA数据库,也有利于相关研究的引用和参考。其他研究人员可以引用和参考已上传数据,从而推动整个领域的研究进程,提高科学研究的质量和影响力。 综上所述,细菌16S rRNA基因测序数据上传NCBI SRA数据库是为了实现数据的共享、提高数据的可靠性和复现性,以及促进相关研究的引用和参考。这将对于细菌基因组学研究的发展和推动具有积极的意义。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

白墨石

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值