今天的西瓜不太好吃,啊啊啊
今天看到LDA,但是对西瓜书上讲解的LDA不是很理解,然后就自己找了相关资料,希望能够给自己通俗的讲明白。
一、LDA简介
LDA是一个经典的线性学习方法,主要用于二分分类问题,扩展以后可以解决多分分类。
LDA和PCA都是利用降维思想,与PCA不同的C是,LDA主要是针对带有标签的数据,将带有标签的数据降维,投影到低维空间同时满足三个条件:
- 尽可能多地保留数据样本的信息(即选择最大的特征是对应的特征向量所代表的的方向)。
- 寻找使样本尽可能好分的最佳投影方向。
- 投影后使得同类样本尽可能近,不同类样本尽可能远。
符号介绍:
- x:表示训练样本,向量表示,即每个西瓜
- C:表示有C类样本,C种瓜
- :第i类样本均值,(i=1,2,……,C)
- :映射后第i类样本均值
- w:样本每个特征的权重,即西瓜的颜色、根须是否卷曲对西瓜是否为好瓜的重要性
- b:偏置量
- Mi:表示第i类训练样本的数目,第i类西瓜的个数
- M:训练样本的总数,全部西瓜的个数