Naive BayesClassifier(朴素贝叶斯)

最新推荐文章于 2023-12-02 22:47:23 发布

@yuqing_wang

最新推荐文章于 2023-12-02 22:47:23 发布

阅读量160

点赞数

分类专栏：统计学习（李航）

本文链接：https://blog.csdn.net/weixin_43199124/article/details/111407081

版权

统计学习（李航）专栏收录该内容

12 篇文章 0 订阅

订阅专栏

朴素贝叶斯的学习和分类

模型

输入：
$x\in R^p$ ,p维特征向量

输出
$y\in\{1,2,\cdots,K\}$ ,，类别标记

训练数据集
$T=\{(x_1,y_1),\cdots,(x_n,y_n)\}$

模型假设
$(x, y)$ 由 $p (x, y)$ 产生
条件独立性假设：
$P(X=x|Y=c_k)=\prod_{i=1}^p p(X^i=x^i|y=c_k)$

目标：
学习 $p (x, y)$
之后给定x，求出后验概率最大的y作为分类变量输出

学习：
先验概率： $p (y)$
条件概率：
$p(X=x|Y=c_k)=P(X^1=x^1,X^2=x^2,\cdots,X^p=x^p|Y=c_k)$

后验概率最大化
$P\left(Y=c_{k} \mid X=x\right)=\frac{P\left(X=x \mid Y=c_{k}\right) P\left(Y=c_{k}\right)}{\sum_{k} P\left(X=x \mid Y=c_{k}\right) P\left(Y=c_{k}\right)}$

分类依据：
$y=argmax_{c_k}p(Y=c_k)\prod_{i=1}^p p(X^i=x^i|y=c_k)$

后验概率最大化==期望风险最小化（选择0-1）损失函数
proof：
0-1损失函数
$f(x)=argmin_{y}\sum_{k=1}^KI(y\neq C_k)p(C_k|X=x)=argmin_{y} 1-I(y= C_k)p(C_k|X=x)=argmax_{y}I(y= C_k)p(C_k|X=x)$

参数估计

极大似然估计

先验概率的极大似然估计：
$p(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_k)}{N}$
条件概率的极大似然估计
$P\left(X^{(j)}=a_{j l} \mid Y=c_{k}\right)=\frac{\sum_{i} I\left(x_{i}^{(j)}=a_{j l}, y_{i}=c_{k}\right)}{\sum_{i} I\left(y_{i}=c_{k}\right)}$

学习和分类的算法

在这里插入图片描述

贝叶斯估计

极大似然估计有可能出现先验概率为0的情况，此时会影响条件概率的估计这是后采取贝叶斯估计
贝叶斯估计等价于随机变量在各个取值的频数上加上 $\lambda$ ,一般 $\lambda =1$
条件概率
$P\left(X^{(j)}=a_{j l} \mid Y=c_{k}\right)=\frac{\sum_{i} I\left(x_{i}^{(j)}=a_{j l}, y_{i}=c_{k}\right)+\lambda}{\sum_{i} I\left(y_{i}=c_{k}\right)+s_j\lambda}$
$s_j$ 为 $x_j$ 可以取值的种类数目

先验概率
$p(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_k)+\lambda}{N+k\lambda}$

@yuqing_wang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Naive BayesClassifier(朴素贝叶斯)

朴素贝叶斯的学习和分类模型输入：x∈Rpx\in R^px∈Rp,p维特征向量输出y∈{1,2,⋯ ,K}y\in\{1,2,\cdots,K\}y∈{1,2,⋯,K},，类别标记训练数据集T={(x1,y1),⋯ ,(xn,yn)}T=\{(x_1,y_1),\cdots,(x_n,y_n)\}T={(x1,y1),⋯,(xn,yn)}模型假设(x,y)(x,y)(x,y)由p(x,y)p(x,y)p(x,y)产生条件独立性假设：P(X=x∣Y=ck)=∏i=1pp(Xi=x
复制链接

扫一扫