LDA Effect Size分析 LEfSe详解

LEfSe(LDA Effect Size)是一种用于发现不同组间存在显著差异的biomarker的分析方法。通过Kruskal-Wallis检验筛选属的显著差异,接着使用Wilcoxon秩和检验处理潜在的影响因素,最后运用LDA评估biomarker的重要性,以揭示生物标志物在区分不同群体中的作用。
摘要由CSDN通过智能技术生成

LDA Effect Size分析 LEfSe详解

LEfSe的作用

在介绍LEfSe的作用前,我们先解释一个概念——biomarker,维基百科给出的定义是

A bio-marker, or biological marker is a measurable indicator of some biological state or condition. Biomarkers are often measured and evaluated to examine normal biological processes, pathogenic processes, or pharmacologic responses to a therapeutic intervention.

用我们搞数据的人能理解的话讲,biomarker就是非常强力的用来分类的特征,它可以是基因、细胞或者物种分类单元等。比如(瞎编的例子,不能当真)某个研究团队发现脚气会影响中央后回位于Sylvian Fissure附近的区域,从而影响舌头的知觉,于是这个团队打算进一步研究脚气怎么通过肠脑轴影响舌头的知觉,他们随机调查了一批志愿者,记录了志愿者的一些demographic information以及病理信息,并记录了他们肠道菌群的物种分类信息与物种丰度,于是他们有了一张数据表:

Group 有脚气 无脚气
界.门.纲.目.科.属1 丰度 丰度
界.门.纲.目.科.属2 丰度 丰度
。。。

他们想知道哪个属的细菌的丰度在有脚气与无脚气的志愿者之间是存在显著差异的,这个时候就需要LDA Effect Size分析了。

也就是说LDA Effect Size分析的作用是发现不同group之间存在显著差异的biomarker。下面我们介绍LDA Effect Size分析的原理。

LEfSe的原理

首先我们写出数据,用 i i i表示第 i i i个志愿者, i = 1 , 2 , ⋯   , n i=1,2,\cdots,n i=1,2,,n,用 y i y_i yi表示第 i i i个志愿者所在的group, y i ∈ { 1 , 2 , ⋯   , K } y_i \in \{1,2,\cdots,K\} yi{ 1,2,,K} (比如讨论有无脚气时 K = 2 K=2 K=2,我们可以用 y i = 1 y_i=1 yi=1表示志愿者 i i i有脚气,用 y i = 2 y_i=2 yi=2表示志愿者 i i i无脚气),用 x i x_i xi表示第 i i i个志愿者的肠道菌群物种分类信息,
x i = ( x i 1 , ⋯   , x i M ) T x_i = (x_{i1},\cdots,x_{iM})^T xi=(xi1,,xiM)T

比如 x i 1 x_{i1} xi1可以表示是Bacteroidaceae(拟杆菌科)、 x i 2 x_{i2}

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值