LDA原理 statQuest

在某些例子中,比如一个药物对哪些病人有效,哪些无效,我们可以尝试依据病人的基因表达来区分。我们可以选取一个或多个基因,但目的是要选取那些可以最大化提升区分这两组病人能力的基因。和PCA类似,但是PCA目的是提取variation最大的基因。

LDA is like PCA, but it focuses on maxmizing seperatibility among known categories.

例子:

从2维图降维1维图:这里写图片描述
这里写图片描述
LDA用2个基因的信息去创造一个新的坐标,并把点投射到这个新坐标,从而使得2个categories区分最大化。

多维图2个group,或者多维图3个group:
这里写图片描述
这里写图片描述

PCA和LDA相似点:

两个方法会基于新坐标的重要性排序。

​ 1, PC1(PCA创建的第一个坐标)解释了数据最多的variation。

​ 2,LD1(LDA第一个创建的坐标)解释了categories之间最多的variation。

两个方法都可以让我们知道哪些基因构建了这新的坐标。(比如PCA可以看loading scores,LDA which gene or variable correlate with the new axis)。

总结:
这里写图片描述

来源:StatQuest

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值