2018.11.08
问题描述:
我们从数据库传输数据的时候,常常喜欢用prefetch来下载,prefetch是集成在sratoolkit包中的一个软件,但是手动安装,往往会有各种麻烦和报错,所以,我还是选用了conda来安装,使用conda之前,先创建一个python2的小环境:
conda create -n python2 python=2.7 #创建python2小环境
source activate python2 #进入到python2
conda search sratoolkit # 在镜像中搜索sratoolkit
conda install sratoolkit -y #安装
#可以用conda list命令查看是否安装成功了,也可以是其他的,比如which prefetch等
要下载的数据SRA号保存在/home/amliang/rnaseq/目录下的srr.list文件中,然后使用conda安装prefetch来下载我们需要的数据,发现报错了,如下图所示:
说什么在虚拟文件系统中找不到路径……,一看,我就傻眼了,这到底搞得什么乱七八糟的,我也没搞明白是咋回事,心浮气躁的我一心想快点把整个流程跑完,不然也不能老是卡在哪一步不动嘛,于是就放弃了用python2环境下的prefetch,准备手动安装sratoolkit,安装脚本如下:
mkdir bio_soft && cd bio_soft
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-centos_linux64.tar.gz # 选择不同系统下的版本,我们实验室的服务器系统是centOS7。
tar -zxvf sratoolkit.2.8.2-1-centos_linux64.tar.gz
echo 'PATH=$PATH:~/bio_soft/sratoolkit.2.8.2-1-centos_linux64.tar.gz/bin' >> ~/.bashrc
source ~/.bashrc #添加到环境变量,
which prefetch #测试一下是否安装成功,或者用prefetch --version查看版本也可以
##然后开始下载数据
cat /home/amliang/rnaseq/srr.list |while read id; do (prefetch $id); done
结果,如下图所示:
发现,手动安装下的prefetch,可以正常运行了,那就这样吧,很OK。
那么,经验教训是,能手动安装的尽量手动,Anaconda is a snake(jimmy师兄之前的一篇文章)。
生信技能树论坛