机器学习-08 自学笔记基于sklearn 线性和二次判别分析

最新推荐文章于 2022-01-22 14:38:38 发布

布比与迈克大炮

最新推荐文章于 2022-01-22 14:38:38 发布

阅读量291

点赞数

分类专栏： sklearn 文章标签：机器学习

本文链接：https://blog.csdn.net/bubid/article/details/108371028

版权

本文介绍了机器学习中的线性判别分析（LDA）和二次判别分析（QDA），用于分类问题。LDA适用于线性边界，而QDA则允许二次边界，提供更灵活的决策面。内容包括LDA和QDA的数学公式，以及如何通过贝叶斯定理建立概率模型。此外，还讨论了LDA的降维特性，并通过Iris数据集和PCA进行了对比分析。

摘要由CSDN通过智能技术生成

机器学习-08 自学笔记基于sklearn 线性和二次判别分析

线性和二次判别分析
- [LDA 和 QDA 分类器的数学公式](http://www.scikitlearn.com.cn/0.21.3/3/#12)
- [LDA 的降维数学公式](http://www.scikitlearn.com.cn/0.21.3/3/#123-lda)
代码重现

线性和二次判别分析

机器学习另一个应用是分类问题，就比如说，一个水果店有苹果、香蕉、梨三种水果，现在新上了苹果梨这种水果，那么苹果梨是属于苹果呢，还是梨呢。用机器学习的算法解决这个问题，就是分类问题。
在分类问题中最重要的是分类器，也就是分类算法。通过分类器，可以确定决策平面，就比如水果店问题，会把平面分成苹果、香蕉、梨三个平面，到时候只需要看，苹果梨落在哪个平面里，它就会被分到该类下。
线性判别分析只能学习线性边界，而二次判别分析则可以学习二次边界，因此它相对而言更加灵活。

LDA 和 QDA 分类器的数学公式

LDA 和 QDA 都是源于简单的概率模型，这些模型对于每一个类别 $k$ 的相关分布 $P (X ∣ y = k)$ 都可以通过贝叶斯定理所获得。

$\frac{P(X | y=k) P(y=k)}{P(X)} = \frac{P(X | y=k) P(y = k)}{ \sum_{l} P(X | y=l) \cdot P(y=l)}$
对于线性以及二次判别分析， P(X|y) 被建模成密度多变量高斯分布:
$\frac{1}{(2\pi)^n |\Sigma_k|^{1/2}}\exp\left(-\frac{1}{2} (X-\mu_k)^t \Sigma_k^{-1} (X-\mu_k)\right)$