序列比对的几种情况记录

最新推荐文章于 2024-12-16 08:39:43 发布

Hello World and You

最新推荐文章于 2024-12-16 08:39:43 发布

阅读量799

点赞数 8

文章标签：学习方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51334807/article/details/135851091

版权

本文介绍了在生物信息学中，如何通过SAM文件中的标签判断reads的唯一性（Uniquereads）、错配情况以及duplication的识别。讨论了保留或过滤这些类型reads的决策依据，如测序深度、产品质量和计算方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

序列比对

比对情况

Unique reads : 仅有一个最优比对位置的reads，因此有多个最优比对位置的reads就不是unique reads

如何判断一条reads是否是unique reads？

1.sam文件中XT:A:{} 标签，其中U表示仅有一个最优比对，R表示有多个最优比对

2.sam文件中X0:1:n 标签，其中n表示共有多少个最优比对
[图片]

错配： bwa中可以指定-n 参数指定最大允许的错配数量

如何查看序列的错配信息：sam文件的MD:Z:标签

duplication : 由于pcr偏好性导致pcr扩增中出现多条重复reads，测序结果表明多条reads比对到同一个位置

根据泊松定理可以简单的知道，在实际情况下比对到同一位置的reads数量应该非常少，所以duplication主要由于实验误差产生

reads保留

是否应该保留duplication reads?

Duplication reads 通常表示对于同一段序列的多次拷贝，往往是由于实验误差导致的，对于揭示生物信息没有意义，一般保留过滤唯一值即可。
Duplication reads过多表示测序质量不高，二代测序的产品质量要求重复率< 10%

重复率计算公式：（1-Duplication reads）/raw reads

在这里插入图片描述

是否应该保留有错配/非Unique reads？

需要根据测序深度，计算方法，产品要求而定，不能一概而论。
目前基本的测试结果和文献证据表明测序数据量不足，结果假阳率明显增且高灵敏度下降。保留部分错配/非Unique reads收益大于不保留。

Hello World and You

博客等级

码龄5年

33
原创

108
点赞

59
收藏

157
粉丝

关注

私信

热门文章

最新评论

pip配置及换源
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
wdl条件判定 if语法及用途
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
wdl条件判定 if语法及用途
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
wdl脚本实战
CSDN-Ada助手: 恭喜您写了第19篇博客，标题为“wdl脚本实战”！您的持续创作精神真令人钦佩。希望您能继续分享关于wdl脚本实战的经验，或者可以考虑探讨一些相关的新领域，比如wdl脚本在大数据处理中的应用等。期待您的下一篇精彩内容！
shell find 指令及实用场景
CSDN-Ada助手: 恭喜您写了这么一篇有用的博客，对于shell find指令的介绍让我受益匪浅。希望您能继续分享更多关于shell指令的实用场景，或者可以考虑介绍一些高级技巧和实用小工具，期待您的下一篇作品。谢谢您的分享！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。