生物信息学基础（五）- seqkit

最新推荐文章于 2024-05-20 17:43:35 发布

jkl_bio

最新推荐文章于 2024-05-20 17:43:35 发布

阅读量386

点赞数

文章标签： linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44619692/article/details/130383937

版权

用于操作fq/fa文件

官方文档：http://bioinf.shenwei.me/seqkit

安装：conda install -c bioconda seqkit

参数详解：

amplicon：通过引物提取扩增子(或其周围的特定区域)

bam：对bam文件进行处理

common：发现多个文件之间的共同序列

concat：从多个文件中连接具有相同ID的序列

convert：在Sanger, Solexa和Illumina之间转换FASTQ质量编码

duplicate：复制n次序列

fa2fq：从fa文件中检索fq文本

fx2tab：将fq/fa文件转换为表格模式，包含GC含量，质量等

genautocomplete：生成shell自动完成脚本(bash|zsh|fish|powershell)

grep：通过ID/name/sequence/sequence/motif搜索序列，允许不匹配

head：提取前n条序列

head-genome：打印第一个基因组的序列，名称中有共同的前缀

locate：定位到subsequences/motifs，允许不匹配

mutate：编辑序列(点突变、插入、删除)

pair：从两个fastq文件匹配成对的reads

range：打印范围内的fq/fa文本

rename：重复id重命名

replace：用正则表达式替代name/sequence

restart：重置环形基因组位置

rmdup：删除重复序列的ID/name/sequence

sample：按数量或比例取样

sana：清理不完整的单行fq文件

scat：对fastx进行连接

seq：可用于选择、滤除或随机提取从FASTA或FASTQ文件中的序列

shuffle：随机序列

sliding：在滑动窗口中提取子序列

sort：按id/name/sequence/length排序

split：按id/seq region/size/parts将序列拆分为文件(主要用于FASTA)

split2：按size/parts序列拆分为文件

stats：fq/fa简单统计

subseq：按照region/gtf/bed获取子序列

sum：计算fq/fa文件中所有序列的消息摘要

tab2fx：将表格格式转换为fq/fa

translate：将DNA/RNA翻译成蛋白质序列

version：版本

watch：实时监控序列文件的数据

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
生物信息学基础（五）- seqkit

split：按id/seq region/size/parts将序列拆分为文件(主要用于FASTA)grep：通过ID/name/sequence/sequence/motif搜索序列，允许不匹配。官方文档：http://bioinf.shenwei.me/seqkit。sort：按id/name/sequence/length排序。rmdup：删除重复序列的ID/name/sequence。subseq：按照region/gtf/bed获取子序列。sum：计算fq/fa文件中所有序列的消息摘要。
复制链接

扫一扫

jkl_bio CSDN认证博客专家 CSDN认证企业博客

码龄6年

49: 原创

117万+: 周排名

60万+: 总排名

1万+: 访问

: 等级

497: 积分

3: 粉丝

6: 获赞

4: 评论

51: 收藏

私信

关注

热门文章

最新评论

生物信息学基础知识（三）
CSDN-Ada助手: 非常感谢用户的第三篇博客，“生物信息学基础知识（三）”。您的持续创作令人钦佩，也为我们提供了很多有价值的知识。下一步，我建议您可以深入探讨一些实际应用案例，让我们更好地了解生物信息学在现实中的应用。再次感谢您的分享，期待您的下一篇文章。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
生物信息学基础知识（二）
CSDN-Ada助手: 是非常重要的，因为它们可以提供关于序列相似性和进化关系的有用信息。在本篇博客中，我们将介绍如何使用BLAST进行序列比对，并解释比对结果中的各种指标。” 非常棒的博客！你的介绍非常清晰，让我更好地了解了BLAST的使用方法和比对结果的解释。希望你可以继续写下去，分享更多生物信息学方面的知识。另外，除了BLAST之外，你可以了解一些其他的序列比对工具，如HMMER和ClustalW等，以扩展你的技能。再次感谢你的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
生物信息学基础知识（一）
CSDN-Ada助手: 非常感谢您分享生物信息学基础知识的第一篇博客！这是一个非常有价值的话题，希望您可以继续分享更多的知识和见解。您的博客将成为许多人学习和了解生物信息学的重要资料。我期待着您未来更多的博客，谢谢您的付出和分享。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
python基础（一）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。