linux上传数据到sra,通过Linux命令行使用Aspera全速上传测序数据到NCBI数据库

本文介绍了如何通过Linux命令行使用Aspera工具,实现满速上传大规模测序数据到NCBI的SRA数据库。详细步骤包括安装Aspera、配置环境变量,以及解决上传过程中遇到的问题,如指定上传子目录以确保数据可见。
摘要由CSDN通过智能技术生成

每试错一次,就离本质就更近一步。----小蓝哥

为什么要上传数据

师姐找我帮忙上传宏基因组数据到NCBI,大概是45G。NCBI提供了很多种可供选择的上传方式:

1db24db5e6c37e263fbdadf14df1a90a.png

多丰富多彩的上传方式

没有海外节点 + 学校的龟速网速,网页上传的速度可想而知,ftp又很容易断,据说Aspera上传能够达到满速上传,就想试一下。

Aspera有浏览器插件,下载试了几次都不行。决定试一下命令行方式。前前后后上传了大约100G数据,终于把这种满速上传数据的方法掌握了。

命令行方式分成Windows下的方式和Linux命令行模式,Windows还需要配制环境变量,比较麻烦,索性采用Linux命令行上传。

电脑配置

Oracle VM VirtualBox 虚拟机配Ubuntu 18.0操作系统 + FinalShell。虚拟机当个小服务器,FinalShell是国产的Shell,目前接触过的Shell中比较好用的。

75e8676f5ca6d10dfcc4ba8cc78c050f.png

界面是长这样的

软件准备

第一步是get到Aspera的Linux版本:

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
细菌16S rRNA基因测序数据上传NCBI SRA数据库是非常重要的。SRA(Sequence Read Archive)是一个公共数据库,它存储了各种生物的DNA和RNA测序数据,包括细菌。下面我将解释为什么要将细菌16S rRNA基因测序数据上传NCBI SRA数据库。 首先,通过将16S rRNA基因测序数据上传NCBI SRA数据库,可以实现数据的共享和开放。科研人员可以从中共享和获取数据,提高科学研究的效率和可信度。这种共享可以促进各种细菌基因组学研究的进展,并促使更多的研究人员参与进来。 其次,通过上传数据NCBI SRA数据库,可以提高数据的可靠性和复现性。对科研成果的复现是科学研究的基石,它可以验证实验结果的准确性和可信度。当同一份数据被共享并上传NCBI SRA数据库时,其他研究人员可以验证和重复原来的研究,从而增加了数据的可靠性。 此外,将细菌16S rRNA基因测序数据上传NCBI SRA数据库,也有利于相关研究的引用和参考。其他研究人员可以引用和参考已上传数据,从而推动整个领域的研究进程,提高科学研究的质量和影响力。 综上所述,细菌16S rRNA基因测序数据上传NCBI SRA数据库是为了实现数据的共享、提高数据的可靠性和复现性,以及促进相关研究的引用和参考。这将对于细菌基因组学研究的发展和推动具有积极的意义。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值