数据挖掘 | 判别分析 +朴素贝叶斯分类算法

最新推荐文章于 2022-10-10 21:08:20 发布

已患月岛萤综合症

最新推荐文章于 2022-10-10 21:08:20 发布

阅读量1.5k

点赞数 1

分类专栏： Machine Learning 数据挖掘文章标签：数据挖掘机器学习

本文链接：https://blog.csdn.net/weixin_43521859/article/details/124316449

版权

本节记录一下由贝叶斯定理延伸出来的几种预测性建模的方法，主要为线性判别分析(一次，二次)，朴素贝叶斯(稍稍提一下贝叶斯网络)

1. 判别分析

判别分析适用于自变量连续，因变量为分类型的情形；

设因变量 $Y$ 一共有 $K$ 个类别； $\epsilon_l=P(Y=l)$ 表示类别 $l$ 的先验概率，满足 $\sum^K_{l=1}\epsilon_l=1$ ； $f_l(\bold{x})=f(\bold{x}|Y=l)$ 表示类别 $Y = l$ 的观测下自变量 $\bold{X}=(X_1,\cdots,X_p)$ 的概率密度函数；

由贝叶斯公式
$P(Y=l|\bold{X}=\bold{x})=\frac{P(Y=l)f(\bold{x}|Y=l)}{\sum^K_{i=1}P(Y=i)f(\bold{x}|Y=i)}=\frac{\epsilon_lf_l(\bold{x})}{\sum^K_{i=1}\epsilon_if_i(\bold{x})}$

则预测 $\bold{x}$ 的类别 $l^*$ 为
$l^* = \underset{l}{argmax}\ P(Y=l|\bold{X}=\bold{x}) = \underset{l}{argmax}\ \epsilon_lf_l(\bold{x})$

线性判别分析的假设为，观测自变量满足多元正态分布，即 $f_l(\bold{x})\sim MVN(\bold{\mu}_l,\bold{\Sigma}_l)$

1.1 线性判别分析

在上述假设中进一步假设所有类别的协方差矩阵都相等： $\Sigma_l=\Sigma,l=1,\cdots,K$

前述已经将预测类别的类转化为求 $\underset{l}{argmax}\ \epsilon_lf_l(\bold{x})$ ，我们稍微计算一下
$\begin{aligned} log(\epsilon_lf_l(\bold{x}))&=log[\epsilon_l\frac{1}{(2\pi)^{\frac{p}{2}}|\Sigma|^{\frac{1}{2}}}exp\{-\frac{1}{2}(\bold{x}-\bold{\mu}_l)^T\Sigma^{-1}(\bold{x}-\bold{\mu}_l)\}]\\ &= \delta_l(\bold{x})+A\\ \end{aligned}$

最低0.47元/天解锁文章

已患月岛萤综合症

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘 | 判别分析 +朴素贝叶斯分类算法

本节记录一下由贝叶斯定理延伸出来的几种预测性建模的方法，主要为线性判别分析(一次，二次)，朴素贝叶斯(稍稍提一下贝叶斯网络)1. 判别分析判别分析适用于自变量连续，因变量为分类型的情形；设因变量YYY一共有KKK个类别；ϵl=P(Y=l)\epsilon_l=P(Y=l)ϵl=P(Y=l)表示类别lll的先验概率，满足∑l=1Kϵl=1\sum^K_{l=1}\epsilon_l=1∑l=1Kϵl=1；fl(x)=f(x∣Y=l)f_l(\bold{x})=f(\bold{x}|Y=l.
复制链接

扫一扫