从NCBI当中SRA数据库中下载高通量测序数据

最新推荐文章于 2024-03-20 09:35:49 发布

wangchuang2017

最新推荐文章于 2024-03-20 09:35:49 发布

阅读量1.9k

点赞数

文章标签：其他

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010608296/article/details/121325978

版权

生物信息学专栏收录该内容

642 篇文章 404 订阅

订阅专栏

从NCBI当中SRA数据库中下载高通量测序数据

用迅雷替代官方的prefetch批量下载SRA测序数据，更快更稳定！

用别人的数据，发自己的文章

由于大多数杂志在文章发表前要求公开数据，所以随着测序文章的爆发，NCBI的SRA数据库当中积累了海量的测序数据。我们可以利用这些数据重新做数据挖掘，发表新的文章。

官方下载方法不太稳

要利用数据，首先得下载得到数据，虽然SRA数据库提供的SRA Toolkit 工具包里的prefetch可以下载，但是用这个方法下载数据需要经过复杂的设置，而且经常莫名奇妙的下不了，总的来说体验很差。

其实老朋友迅雷也是可以下载的

下面通过一个例子介绍如何用迅雷下载SRA数据：

例如，我们要下载SRP108428（阅读文献可以找到公开数据的project号）下的所有数据，打开NCBI网址：https://www.ncbi.nlm.nih.gov/Traces/study/?acc=SRP108428（此处为project号），点击"Accession List"键，下载得到SRR List 储存在sra.txt文件中。

打开sra.txt文件：

那么我们就可过下载地址规律生成所有样品的ftp的下载地址：

ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR563/SRR5631562/SRR5631562.sra

注：头部都一样(黑色字)，后面地址分别为SRR，SRR+前三个数、SRR号、SSR号.sra

得到如下结果：

最后，将链接粘贴到迅雷下载即可，是不是很方便？

Tips:

如果下载上百个样品，手动粘贴就太累了。在Linux下可以实现一键自动产生下载链接，输入文件为sra.txt，给出命令：

cat SRR_Acc_List.txt|while read a ;do t1=${a:0:3};t2=${a:0:6};echo "ftp://ftp-trace.ncbi.nih.gov/sra/sra-

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wangchuang2017 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。