软件安装
手动在ncbi下载了一些sra文件,一看后缀.man,查了下发现是一个压缩包,双端测序文件,解压后可以得到两个fastq文件。
那么问题来了,怎么解压?
第一种:直接尝试改后缀为.7z,解压失败。
第二种:利用sratoolkit
1. 去ncbi下载sratoolkit,简单粗暴。中间发现打不开,原来链接的是github
选择window 64 位,下载,解压。
将bin文件的路径加入到系统变量中,参考了(53条消息) Windows系统下载SRA数据,使用sratoolkit工具_铭&婵旭的博客-CSDN博客
win+R输入sysdm.cpl,打开配置path,点击环境变量,再点击系统变量的path,点击新建,把你存放sratoolkit的路径复制黏贴加上去,最后点击确定。
在cmd或者powershell利用cd指令进入存放sratoolkit的目录,或者也可以直接在当前目录下进行。
输入(存放你这个下载包的路径)sratoolkit.3.0.1-win64\bin\prefetch.exe -h
这样就可以直接使用这个工具进行下载和解压啦!我直接就成功了,如果有没有成功的可以继续参考这个方法:
一开始是报错的,它显示我要配置,没有图片保存就用文字描述,报三行代码,那我就根据这个输入vdb-config --interactive,出现配置界面,但是这个界面我好想没有改动什么,反正我按了s,再按x就退出了,再运行bin\prefetch.exe -h,显示帮助信息,就是安装成功。
然后一定要注意使用工具的时候路径是正确的,要不就cd到这个bin文件下直接输入prefetch.exe -h
下载sra文件
不详述,两种方法:
1. 单个:prefetch [accession list]
2. 批量:prefetch.exe --option-file 你存放accession list的txt,分行符分割
解压
下载后的数据一般是无后缀/srr后缀/man后缀,这时候就有一个要解压开的问题,解压了才能获得fastq文件。
解压要用bin目录下的工具fasterq-dump.exe
查找了一下,在不知道是双端数据还是单端数据的情况下用 --split-3最合适
我喜欢在数据的目录下进行,这时候记得在用工具时加上路径
(之前我解压,每次都要一个小时,后来才发现原因,是因为没有加上man后缀,每次都是重新下载+解压。也就是说:如果文件夹下没有这个文件,faster-dump就会重新下载再解压!!!正常解压已下载的文件一分钟不到!)
[安装路径]\sratoolkit.3.0.1-win64\bin\fasterq-dump.exe --split-3 SRR121928.man
一些参数的介绍可以看Fastq-dump: 一个神奇的软件 - 简书 (jianshu.com)