Bracken丰度校正原理

最新推荐文章于 2024-05-27 09:53:39 发布

生物工具人

最新推荐文章于 2024-05-27 09:53:39 发布

阅读量380

点赞数

分类专栏：物种分类文章标签：算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40182103/article/details/132131373

版权

本文详细阐述了Bracken校正kraken2丰度的原理，重点介绍了基于贝叶斯方法的理论基础，包括如何计算P(Gj)、P(Gj∣Si)和P(Si)，以解决read分配误差导致的丰度不准确问题。

摘要由CSDN通过智能技术生成

目录

1.基本概念介绍
- 1.1 k-mers（有基础的朋友可以不看）
- 1.2 kraken2丰度结果格式（*重要*）
2.基于贝叶斯的方法（理论基础）

本文旨在介绍Bracken的校正kraken2丰度的原理。另外要注意的是， $Abund_{S_i}$ 这里求得的是read数量，Bracken并没有考虑基因组长度。

1.基本概念介绍

1.1 k-mers（有基础的朋友可以不看）

  k-mers就是按一定长度作为最小单元，对序列打断。

1.2 kraken2丰度结果格式（重要）

  kraken2丰度结果的为什么需要校正：
  当read比对到 Tf 和 Ts 的基因组共有区域时，kraken2会将read分配给最近公共祖先LCA（Lowest Common Ancestor），也就是Tannerella和其他属。所以，要估计 Tf 和 Ts 的丰度，我们要知道Tannerella和其他属的level_reads中有多少read是属于 Tf 和 Ts 的。

2.基于贝叶斯的方法（理论基础）

2.1.问题及数学描述

求：S1和S2的丰度？

需要解决的问题是：有一部分read属于S1或S2，但被分配给了G1，G2。

假设：
事件 $S_i$ ：属于 $S_i$ 的reads；
事件 $G_j$ ：被kraken2分配给 $G_j$ 的read；
$Abund_{S_i}$ ： $S_i$ 的丰度；
m：属于 $S_i$ 的一部分read被kraken2分配给m个 $G j$ ；
$levelreads_{G_j}$ ：被kraken2分配给 $G_j$ 的独有read，例如，Tannerella的levelreads = 26；
$allreads_{S_i}$

最低0.47元/天解锁文章

生物工具人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Bracken丰度校正原理

本文旨在介绍Bracken的校正kraken2丰度的原理。另外要注意的是，$Abund_{S_i}$ 这里求得的是read数量，Bracken并没有考虑基因组长度。
复制链接

扫一扫

专栏目录

生物工具人 CSDN认证博客专家 CSDN认证企业博客

码龄7年

6: 原创

143万+: 周排名

215万+: 总排名

1485: 访问

: 等级

60: 积分

0: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

分类专栏

物种分类 1篇
linux 1篇
爬虫 1篇

最新评论

标准化scale
CSDN-Ada助手: 恭喜您写出了第四篇博客，标题为“标准化scale”！您的创作热情令人钦佩。接下来，我建议您可以继续深入探讨标准化scale的相关内容，或者尝试写一些实践案例，让读者更好地理解和应用。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。