RNA-seq——快速下载SRA数据、解决fq文件中测序质量全为 ‘?‘ 的问题

在学习RNA-seq分析时,遇到SRA数据下载后fastq文件测序质量全为'?'的问题。通过GEO数据库查找GSE号,利用SRA Run Selector定位数据。下载方法包括直接下载fastq.gz文件和使用aspera或sratoolkit,后者能解决质量问题。在Linux环境中安装sratoolkit并用prefetch命令可快速下载完整质量数据。
摘要由CSDN通过智能技术生成

写在前面——在学习RNA-seq时,需要从网上下载公开数据集来上手分析,大部分教程都很古老,其中在ncbi中ftp的下载链接已经不存在了,甚至可以直接下载fastq文件。但是,直接下载的fastq文件做fastqc之后结果为一条直线,因为文件里的测序质量都是30,要想下载带正常质量数据的文件需要换一种方法。

RNA实战:http://www.bio-info-trainee.com/2218.html

sra数据如何寻找:

  1. 查找对应的GSE:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177
    可以直接复制链接,然后在对应的文章中找到GSE号,把链接中的GSE修改一下即可。

在这里插入图片描述

  1. SRA Run Selector:https://www.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA21729
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值