python处理fastq文件_fastq格式文件处理大全（五）

最新推荐文章于 2024-05-24 10:05:25 发布

weixin_39875192

最新推荐文章于 2024-05-24 10:05:25 发布

阅读量2.5k

点赞数

文章标签： python处理fastq文件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39875192/article/details/111631666

版权

从计算机的角度来说，生物的序列属于一种字符串，也是一种文本，因此生物信息分析属于文本处理范畴。文本存储为固定格式文件，生物信息的工作就是各种文本文件之间格式的转换，例如通过序列拼接将fastq转换为fasta，通过短序列比对将fastq与fasta合并为bam，通过变异检测将bam中突变位点提取出来转换为vcf。因此，我们可以通过总结每一种生物数据文件格式的处理方法来学习生物信息，这样当拿到固定格式的文件之后，就知道该如何来处理了。

fastq格式文件处理大全（一）

fastq格式文件处理大全（二）

fastq格式文件处理大全（三）

fastq格式文件处理大全（四）

排序

如果想对fastq格式文件进行排序，可以使用seqkit sort功能，我们可以对nanopore测序数据，按照长度从大到小进行排序，这样方便取出最长的序列。默认按照从小到大顺序，加上-r可以按照从大到小进行排序。

seqkit sort -l -r nanopore.fastq.gz

抽样

有时候需要从全部文件中抽取一部分进行分析

最低0.47元/天解锁文章

weixin_39875192

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python处理fastq文件_fastq格式文件处理大全（五）

从计算机的角度来说，生物的序列属于一种字符串，也是一种文本，因此生物信息分析属于文本处理范畴。文本存储为固定格式文件，生物信息的工作就是各种文本文件之间格式的转换，例如通过序列拼接将fastq转换为fasta，通过短序列比对将fastq与fasta合并为bam，通过变异检测将bam中突变位点提取出来转换为vcf。因此，我们可以通过总结每一种生物数据文件格式的处理方法来学习生物信息，这样当拿到固定...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。