多线程解压SRA格式 | pfastq-dump工具

扫描加入

前言

下载组学数据一般为SRA文件格式,需要将其拆分为FQ文件格式,常用的工具是NCBI中的fastq-dump软件进行拆分。

但是,fastq-dump软件只能使用单线程运行,速度非常慢。可以看教程转录组上游分析教程 | NCBI转录组数据的下载

**那么如何实现多线程快速拆分呢?**今天我们推荐大家使用pfastq-dump工具,实现多线程运行,提供工作效率。

pfastq-dump安装

  1. 下载网址
https://github.com/inutano/pfastq-dump
  1. 安装

可以直接使用git clone进行下载

$ git clone https://github.com/inutano/pfastq-dump
$ cd pfastq-dump
$ chmod a+x bin/pfastq-dump
  1. 下载源码安装包
https://github.com/inutano/pfastq-dump/releases


下载后解压,操作上同。

  1. 添加路径
    将路径写到~/.bashrc中,输入命令vim ~/.bashrc
PATH=$PATH:~/software/pfastq-dump/bin
  1. 运行
pfastq-dump -h
Usage:
pfastq-dump --threads <number of threads> [options] <path> [<path>...]

pfastq-dump option:
-t|--threads         number of threads
-s|--sra-id          SRA id
-O|--outdir          output directory
--tmpdir             temporary directory

Extra arguments will be passed through

Other:
-v|--version         show version info
-h|--help            program usage
  1. pfastq-dump使用与fastq-dump一致
## 双端数据
pfastq-dump -t 58 --split-files *.sra
## 单段数据
fastq-dump -t 58 *.sra

若我们的教程对你有所帮助,请点赞+收藏+转发,这是对我们最大的支持。

往期部分文章

1. 最全WGCNA教程(替换数据即可出全部结果与图形)


2. 精美图形绘制教程

3. 转录组分析教程

4. 转录组下游分析

小杜的生信筆記 ,主要发表或收录生物信息学教程,以及基于R分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!

  • 15
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小杜的生信筆記

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值