数据挖掘 | 判别分析 +朴素贝叶斯分类算法

本节记录一下由贝叶斯定理延伸出来的几种预测性建模的方法,主要为线性判别分析(一次,二次),朴素贝叶斯(稍稍提一下贝叶斯网络)

1. 判别分析

判别分析适用于自变量连续,因变量为分类型的情形;

  • 设因变量 Y Y Y一共有 K K K个类别; ϵ l = P ( Y = l ) \epsilon_l=P(Y=l) ϵl=P(Y=l)表示类别 l l l的先验概率,满足 ∑ l = 1 K ϵ l = 1 \sum^K_{l=1}\epsilon_l=1 l=1Kϵl=1 f l ( x ) = f ( x ∣ Y = l ) f_l(\bold{x})=f(\bold{x}|Y=l) fl(x)=f(xY=l)表示类别 Y = l Y=l Y=l的观测下自变量 X = ( X 1 , ⋯   , X p ) \bold{X}=(X_1,\cdots,X_p) X=(X1,,Xp)的概率密度函数;

由贝叶斯公式
P ( Y = l ∣ X = x ) = P ( Y = l ) f ( x ∣ Y = l ) ∑ i = 1 K P ( Y = i ) f ( x ∣ Y = i ) = ϵ l f l ( x ) ∑ i = 1 K ϵ i f i ( x ) P(Y=l|\bold{X}=\bold{x})=\frac{P(Y=l)f(\bold{x}|Y=l)}{\sum^K_{i=1}P(Y=i)f(\bold{x}|Y=i)}=\frac{\epsilon_lf_l(\bold{x})}{\sum^K_{i=1}\epsilon_if_i(\bold{x})} P(Y=lX=x)=i=1KP(Y=i)f(xY=i)P(Y=l)f(xY=l)=i=1Kϵifi(x)ϵlfl(x)

则预测 x \bold{x} x的类别 l ∗ l^* l
l ∗ = a r g m a x l   P ( Y = l ∣ X = x ) = a r g m a x l   ϵ l f l ( x ) l^* = \underset{l}{argmax}\ P(Y=l|\bold{X}=\bold{x}) = \underset{l}{argmax}\ \epsilon_lf_l(\bold{x}) l=largmax P(Y=lX=x)=largmax ϵlfl(x)

  • 线性判别分析的假设为,观测自变量满足多元正态分布,即 f l ( x ) ∼ M V N ( μ l , Σ l ) f_l(\bold{x})\sim MVN(\bold{\mu}_l,\bold{\Sigma}_l) fl(x)MVN(μl,Σl)

1.1 线性判别分析

  • 在上述假设中进一步假设所有类别的协方差矩阵都相等: Σ l = Σ , l = 1 , ⋯   , K \Sigma_l=\Sigma,l=1,\cdots,K Σl=Σ,l=1,,K

前述已经将预测类别的类转化为求 a r g m a x l   ϵ l f l ( x ) \underset{l}{argmax}\ \epsilon_lf_l(\bold{x}) largmax ϵlfl(x),我们稍微计算一下
l o g ( ϵ l f l ( x ) ) = l o g [ ϵ l 1 ( 2 π ) p 2 ∣ Σ ∣ 1 2 e x p { − 1 2 ( x − μ l ) T Σ − 1 ( x − μ l ) } ] = δ l ( x ) + A \begin{aligned} log(\epsilon_lf_l(\bold{x}))&=log[\epsilon_l\frac{1}{(2\pi)^{\frac{p}{2}}|\Sigma|^{\frac{1}{2}}}exp\{-\frac{1}{2}(\bold{x}-\bold{\mu}_l)^T\Sigma^{-1}(\bold{x}-\bold{\mu}_l)\}]\\ &= \delta_l(\bold{x})+A\\ \end{aligned} log(ϵlfl(x))=log[ϵl(2π)2pΣ211exp{ 21(xμl)TΣ1(xμl)}]=δl(x)+A

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值