NCBI下载原始测序数据及SRA格式转换为fasta

NCBI下载原始测序数据

  1. 在ncbi里面的SRRXXXX下面找到data access
    在这里插入图片描述
  2. 下载之后是SRA格式,是二进制文件,这时候就要用到SRAToolKIT
~/sratoolkit/bin/fastq-dump -I --split-files SRR390728
#生成两个fastq文件(--split-files),其中包含“ .1”和“ .2”读取对(-I),用于配对端数据

3.这时候得到的是fastq格式的数据,再用工具转换成fasta格式的文件

1 li
要从NCBI SRA数据下载特定的二代测序数据集并进行后续分析,你可以遵循以下详细步骤: 参考资源链接:[NCBI SRA数据库操作指南:从查询到下载测序数据](https://wenku.csdn.net/doc/57tm0nutaa?spm=1055.2569.3001.10343) 首先,确保你已经安装了SRAToolkit。你可以根据你的操作系统下载并安装相应的SRAToolkit版本。例如,对于CentOS系统,可以通过以下命令来下载和安装: ```bash wget *** *** *** ``` 安装完成后,你可以使用`prefetch`命令下载特定的SRA数据集。例如,如果你想下载SRR号为SRR123456的运行数据,可以使用以下命令: ```bash ./prefetch SRR123456 ``` 下载完成后,使用`srapath`命令可以将下载SRA文件转换为更易于处理的文件格式,比如FASTQ。例如: ```bash ./srapath SRR123456.sra ``` 转换完成后,你将得到一个或多个FASTQ格式的文件。这些文件包含了测序读取的序列数据,现在你可以使用序列比对工具如BWA或Bowtie2来进行序列读取和比对信息分析。以下是使用BWA进行比对的一个示例: ```bash bwa index reference.fasta bwa mem reference.fasta SRR123456.fastq > SRR123456.sam ``` 最后,你可以使用samtools工具将SAM格式的比对结果转换为BAM格式,并进行排序: ```bash samtools view -Sb SRR123456.sam > SRR123456.bam samtools sort SRR123456.bam -o SRR123456.sorted.bam ``` 这些步骤将帮助你从NCBI SRA数据下载特定的二代测序数据集,并进行序列读取和比对信息分析。在开始之前,建议你参考《NCBI SRA数据库操作指南:从查询到下载测序数据》这本书籍,以获得更深入的理解和操作指南。这本书详细介绍了NCBI SRA数据库的使用方法,包括数据的搜索、下载、转换以及后续的分析步骤,适合希望提高二代测序数据分析能力的读者。 参考资源链接:[NCBI SRA数据库操作指南:从查询到下载测序数据](https://wenku.csdn.net/doc/57tm0nutaa?spm=1055.2569.3001.10343)
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值