下载数据提示:
This run exceeds the download limit (>5 Gbases). Use SRA Toolkit to download runs locally in your preferred format.
开始安装:
1. 下载SRA Toolkit预编译包
访问NCBI官网下载适用于Linux的预编译版本:
# 进入下载目录(例如用户主目录)
cd ~
# 下载最新版本(以3.0.6为例,请替换为官网最新版本号)
wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/3.0.6/sratoolkit.3.0.6-centos_linux64.tar.gz
# 解压到指定目录(例如/opt/sratoolkit)
sudo tar -xzvf sratoolkit.3.0.6-centos_linux64.tar.gz -C /opt
# 重命名目录(可选,便于管理)
sudo mv /opt/sratoolkit.3.0.6-centos_linux64 /opt/sratoolkit
配置环境变量
将SRA Toolkit的bin
目录添加到系统路径:
# 编辑用户环境配置文件(如使用bash)
nano ~/.bashrc
# 在文件末尾添加以下内容
export PATH="/opt/sratoolkit/bin:$PATH"
# 使配置生效
source ~/.bashrc
验证安装
# 查看fastq-dump版本
fastq-dump --version
# 应输出类似:fastq-dump : 3.0.6
配置SRA Toolkit
运行交互式配置工具,设置缓存和权限:
# 运行配置工具
vdb-config -i
# 按需调整以下参数:
# 1. 按方向键选择 "Cache" → 设置缓存目录(如/home/user/ncbi/cache)。
# 2. 启用 "Remote Access" → 允许从NCBI下载数据。
# 3. 按“s”保存,按“q”退出。
测试工具功能
根据SRA Accession编号(如SRR123456)下载数据:
下载示例SRA数据并转换为FASTQ:
# 下载示例数据(SRR390728)
prefetch SRR390728
# 转换为FASTQ格式
fastq-dump --split-files SRR390728.sra
FAQ
问题1:缺少依赖库
若运行时报错(如libcrypto.so.10 not found
):
# 安装openssl库
sudo yum install openssl-devel
问题2:权限不足
若无法写入缓存目录,需调整目录权限:
sudo chmod -R 755 /path/to/cache_directory
问题3:代理设置
若需通过代理访问NCBI,设置环境变量:
# 在~/.bashrc中添加
export http_proxy="http://your_proxy:port"
export https_proxy="http://your_proxy:port"