fast软件_【Nanopore】5. fast5和fastq格式比较及使用basecalling软件获取序列信息

最新推荐文章于 2023-06-05 11:26:37 发布

weixin_39860919

最新推荐文章于 2023-06-05 11:26:37 发布

阅读量3.5k

点赞数 1

文章标签： fast软件

本文详细介绍了Nanopore测序中fast5和fastq格式的区别，fast5文件的合并拆分，以及Guppy、Albacore和Chiron三种basecalling软件的使用方法和参数解释，旨在帮助理解Nanopore测序数据处理流程。

摘要由CSDN通过智能技术生成

前言

有好几天没有更新了，期间有一些小繁忙，没有充分的时间准备写作素材。

今天周末，有时间写一写了。

前几篇文章中我们分享了Nanopore提高碱基判读准确性的几种方法：包括改善1)测序文库；2)Basecalling工具；3)Reader。今天我们具体看一看basecalling的过程是如何完成的。在3. Basecalling工具比较中我们介绍了目前basecalling准确性较高的三款软件是Guppy、Albacore和Chiron。而其中，Guppy是目前最常用的basecaller，我将着重示例。另外两款软件也给出代码，有需要的可自行尝试。

正文

1. fast5和fastq格式文件比较

在nanopore测序过程中，会在控制软件MinKNOW中设置测序数据的输出文件格式——fast5或fastq。两种文件包含的信息量差异很大。fastq文件是目前二代测序最常用的数据文件格式，主要包含了序列的名称。如下图：

而fast5文档记录了nanopore测序过程中产生的所有设置信息：包括测序过程中产生的电信号、信号间隔时间等等。若需要分析序列甲基化等数据，则必须使用fast5格式，以提取电信号。fast5格式数据如下图(使用过HDFView软件查看)：

因此，如果单纯只分析序列信息，而不需要分析甲基化等信息，可以选择使用fastq文件；而要研究序列修饰信息，则使用fast5文件。

2. fast5格式文件合并与拆分

有时需要对多个fast5文件进行合并，生成一个multi_fast5文件，使得一个fast5文件中可以包含若干条reads，可设定为400

最低0.47元/天解锁文章

weixin_39860919

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。