机器学习-08 自学笔记 基于sklearn 线性和二次判别分析

本文介绍了机器学习中的线性判别分析(LDA)和二次判别分析(QDA),用于分类问题。LDA适用于线性边界,而QDA则允许二次边界,提供更灵活的决策面。内容包括LDA和QDA的数学公式,以及如何通过贝叶斯定理建立概率模型。此外,还讨论了LDA的降维特性,并通过Iris数据集和PCA进行了对比分析。
摘要由CSDN通过智能技术生成

线性和二次判别分析

机器学习另一个应用是分类问题,就比如说,一个水果店有苹果、香蕉、梨三种水果,现在新上了苹果梨这种水果,那么苹果梨是属于苹果呢,还是梨呢。用机器学习的算法解决这个问题,就是分类问题。
在分类问题中最重要的是分类器,也就是分类算法。通过分类器,可以确定决策平面,就比如水果店问题,会把平面分成苹果、香蕉、梨三个平面,到时候只需要看,苹果梨落在哪个平面里,它就会被分到该类下。
线性判别分析只能学习线性边界, 而二次判别分析则可以学习二次边界,因此它相对而言更加灵活。

LDA 和 QDA 分类器的数学公式

LDA 和 QDA 都是源于简单的概率模型,这些模型对于每一个类别 k k k 的相关分布 P ( X ∣ y = k ) P(X|y=k) P(Xy=k)都可以通过贝叶斯定理所获得。

P ( y = k ∣ X ) = P ( X ∣ y = k ) P ( y = k ) P ( X ) = P ( X ∣ y = k ) P ( y = k ) ∑ l P ( X ∣ y = l ) ⋅ P ( y = l ) P(y=k | X) = \frac{P(X | y=k) P(y=k)}{P(X)} = \frac{P(X | y=k) P(y = k)}{ \sum_{l} P(X | y=l) \cdot P(y=l)} P(y=kX)=P(X)P(Xy=k)P(y=k)=lP(Xy=l)P(y=l)P(Xy=k)P(y=k)
对于线性以及二次判别分析, P(X|y) 被建模成密度多变量高斯分布:
p ( X ∣ y = k ) = 1 ( 2 π ) n ∣ Σ k ∣ 1 / 2 exp ⁡ ( − 1 2 ( X − μ k ) t Σ k − 1 ( X − μ k ) ) p(X | y=k) = \frac{1}{(2\pi)^n |\Sigma_k|^{1/2}}\exp\left(-\frac{1}{2} (X-\mu_k)^t \Sigma_k^{-1} (X-\mu_k)\right) p(Xy=k)=

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值