1、BCFtools
Github下载压缩包:https://github.com/samtools/bcftools/releases/download/1.19/bcftools-1.19.tar.bz2
解压:
命令行安装:
#安装相应依赖
$ sudo apt-get install zlib1g-dev
$ sudo apt-get install libbz2-dev
$ sudo apt-get install liblzma-dev
$ sudo apt-get install make
$ cd /xxx/bcftools-1.19 # xxx替换相应路径 cd /home/gary/biotools/bcftools/bcftools-1.19
$ ./configure --prefix=/xxx/xxx # xxx替换安装路径 ./configure --prefix=/home/gary/biotools/bcftools/bcftools
$ make
$ make install
$ export PATH=/xxx/xxx/bin:$PATH # 添加环境变量 export PATH=/home/gary/biotools/bcftools/bcftools/bin:$PATH
安装成功:
使用bcftools时,The VCF will need to have been compressed using bgzip
.
# 常用bgzip对vcf进行压缩
sudo apt install tabix # 安装
bgzip -c input.vcf > input.vcf.gz
2、Sra-tools (NCBI下载器)
查看相关介绍:https://github.com/ncbi/sra-tools/wiki
(1)下载相应系统安装包:https://github.com/ncbi/sra-tools/wiki/01.-Downloading-SRA-Toolkit
(2)跟随教程安装(最后的functional test可能需要一定时间下载数据,可跳过): https://github.com/ncbi/sra-tools/wiki/02.-Installing-SRA-Toolkit
(3)设置相关参数:参考
A. 选择"Remote Access"
B. 转到"Cache"选择"local file-caching"并设置路径(必须是空文件夹),即user-repository
C. 转到"cloud provider"并且选择"report cloud instance identity"
(4) 选择并保存数据信息在cart
文件中
A.登录dbgap
B.点击My Requests,查看批准的请求
C.选择dbGap file selctor下载基因型和表型数据/选择SRA RUN selector下载SRA数据
D.选择数据并下载.krt文件
(5)使用prefetch进行数据下载,介绍(包含修改下载路径)。
A.找到密钥并下载得到.ngc
文件
B.在.krt文件与.ngc
文件存放目录运行prefetch命令下载(默认下载在当前文件夹):
# 添加相应路径到环境变量(即第3步 仅当前终端有效,窗口关闭后变量被删除,下次仍需要再次添加)
export PATH=$PATH:/home/gary/biotools/sratoolkit/sratoolkit.3.0.10-ubuntu64/bin
# cart文件
$ prefetch --ngc prj_35367.ngc DS-ALZ-NPU.krt
# 下载多个文件时使用。
$ prefetch --ngc prj_35367.ngc DS-ALZ-NPU.krt --order kart
# 使用nohup和末尾的&后台运行,-X 99999999 是下载大小限制
$ nohup prefetch -X 9999999999999 --ngc prj_35367.ngc --cart DS-ALZ-NPU.krt &
# SRA accession
$ prefetch --ngc your_file.ngc SRR1234567
等待下载完成, 程序显示结束时仍没有实质文件下载则重启终端
ps:表型数据(.ncbi.enc)解密步骤: 参考1 参考2
$ vdb-decrypt --ngc your_file.ngc ~/ncbi/dbGaP-26086/files/ # 整个表型数据存放的文件夹进行解密
解密完成之后,文件的后缀ncbi_enc不见了。
3、plink
进入下载链接按照电脑配置下载:http://www.cog-genomics.org/plink2/
解压后解压就能直接使用。