PacBio hdf5 格式 向 FASTA格式转换

这篇博客介绍了如何将PacBio测序得到的hdf5格式数据转换为常用的FASTA或FASTQ格式。首先,需要下载并编译安装hdf5库,然后编译dextractor工具,解决可能出现的编译问题。最后,使用dextractor进行格式转换,提供了一个简单的命令行示例。该过程对于处理PacBio测序数据的生物信息学家至关重要。
摘要由CSDN通过智能技术生成

个人比较熟悉FASTA 或者FASTQ文件格式,PacBio 测序得到的数据以hdf5格式存储,在应用过程中如果需要输入相应的fasta 或者fastq格式,需要格式转换。

格式转化工具推荐:Pacbio: extract fastq from h5 file based on quality filtering

我选用的是: dextractor

dextractor 是用c实现的,编译过程依赖hdf5库,需要先安装hdf5库。

第一步:编译安装hdf5库。

hdf5库的下载:HDF5 Source Code

编译安装hdf5的教程在目录 release_docs/中,参数默认,只需要设置安装路径(非root用户)

Instructions for building HDF5 can be found in the release_docs/ directory in the source code.    

第二步:编译安装dextractor

git clone git@github.com:thegenemyers/DEXTRACTOR.git

修改Makefile 中hdf5的路径为第一步中hdf5安装的位置。

make 编译可能会出错,GitHub issue中有提到,需要把代码中 DB_CSS 修改为DB_CCS,编译通过。

第三步:运行dextract

给出个example, 详细参数见GitHub README.

./dextract -v input.bax.h5

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值