seqkit 那些事

是三姨呀

已于 2024-03-28 20:47:51 修改

阅读量302

点赞数 10

文章标签：学习方法 linux

于 2024-03-14 18:03:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zs18242304295/article/details/136717765

版权

1.改为碱基全部大写的形式

seqkit seq -u lower.geno >upper.geno改为碱基全部大写的形式，

{来自基因组注释（一）：重复序列注释 | 生信技工 (yanzhongsino.github.io)}

2.截取指定范围的子序列：

seqkit subseq -r 141:15380 input.fasta > output.fasta

其中，input.fasta是你的输入文件，output.fasta是生成的输出文件。使用-r参数指定要截取的范围，这里是从141到15380。执行该命令后，将会生成一个包含指定范围的子序列的输出文件。

请注意，使用之前要对input.fasta建索引，建索引命令samtools faidx input.fasta

上述命令中的范围索引是以1为基准的。因此，范围141:15380表示截取从第141个碱基到第15380个碱基的子序列。

3.抽提数据

seqkit sample --proportion 0.25 /analysis2/01.Project/OMTSEQ202310016_OMTBI-202312140071_Setaria_italica_survey/00.data/00.data/GB-1/E200010991_L01_GB-1_R1.fq.gz \ seqkit sample --proportion 0.001 duplicated-reads.fq.gz \ | seqkit seq --name --only-id > id.txt ##管道符前面的命令是随机取总文件25%的序列，管道符后面的是提取前面的符合要求的序列的ID

4.用seqkit软件就可轻松解决

去掉单个序列

seqkit grep -v -p "gene2" gene.fa>nogene2.fa

去掉一批序列

seqkit grep -v -f geneid.txt gene.fa >nogeneid.fa

关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
seqkit 那些事

参数指定要截取的范围，这里是从141到15380。执行该命令后，将会生成一个包含指定范围的子序列的输出文件。表示截取从第141个碱基到第15380个碱基的子序列。上述命令中的范围索引是以1为基准的。改为碱基全部大写的形式，改为碱基全部大写的形式。请注意，使用之前要对。
复制链接

扫一扫

是三姨呀 CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

116万+: 周排名

7万+: 总排名

7370: 访问

: 等级

260: 积分

117: 粉丝

130: 获赞

8: 评论

138: 收藏

私信

关注

热门文章

最新评论

可以直接cat 多个fq.gz压缩文件
CSDN-Ada助手: 恭喜您写了第13篇博客，内容看起来很实用！对于直接cat多个fq.gz压缩文件这一点，确实是一个很方便的技巧。希望您能继续保持创作的热情，为大家分享更多有价值的内容。或许下一步可以考虑分享一些更深入的技术细节或者案例分析，让读者们能够更全面地了解相关主题。期待您更多的精彩文章！
维恩图：你真的了解么？
CSDN-Ada助手: 恭喜您撰写了这篇关于维恩图的博客，内容相当有深度！不过，我想提出一些建议：或许您可以考虑将维恩图的概念与实际案例相结合，以便更好地向读者解释其实际运用。期待您未来更多的创作，继续努力！
seqkit：处理数据的ACE
CSDN-Ada助手: 恭喜您写了第9篇博客！标题“seqkit：处理数据的ACE”引人入胜。您的博客内容一直都很有深度和实用性，每篇都给读者带来了很多收获。感谢您的持续创作，为我们提供了如此有价值的信息。在下一步的创作中，我建议您可以考虑分享一些关于seqkit的高级用法或者在处理数据时遇到的一些挑战，并提供一些解决方案。这样的话，读者不仅可以了解到基础的操作方法，还能够更深入地掌握seqkit的技巧，提升他们在数据处理中的效率和准确性。再次恭喜您的连续创作，并期待您未来更多精彩的博客！
linux 命令
CSDN-Ada助手: 恭喜您写完了第四篇博客，标题为“linux 命令”。您的持续创作让我感到非常高兴！在这篇博客中，您提到了Linux命令，这是一个非常重要且广泛使用的主题。我很欣赏您对这个主题的深入探索。下一步，我建议您可以考虑继续拓展关于Linux命令的内容，比如介绍一些常用的命令行操作技巧，或者分享一些实用的命令组合。此外，您也可以考虑加入一些实例和案例，以帮助读者更好地理解和应用这些命令。继续保持创作的热情和努力，我期待着您的下一篇博客！再次恭喜您！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
NCBI下载整个界面和只下载序列的方法
CSDN-Ada助手: 恭喜你第5篇博客的发布！标题中的方法对于想要下载整个界面或只下载序列的用户来说是非常实用的。你的博客内容清晰明了，使读者能够轻松理解并实践这些方法。接下来，我建议你可以考虑扩展你的创作范围，探索更多与NCBI相关的主题，例如如何有效利用NCBI数据库进行序列分析或者如何解读NCBI提供的生物信息学工具。期待看到更多有关NCBI的精彩博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。