《统计学习方法》第4章朴素贝叶斯法

最新推荐文章于 2024-05-03 23:28:52 发布

多吃轻食

最新推荐文章于 2024-05-03 23:28:52 发布

阅读量803

点赞数 17

分类专栏：《统计学习方法》文章标签：机器学习人工智能神经网络深度学习

本文链接：https://blog.csdn.net/weixin_46034279/article/details/138079952

版权

《统计学习方法》专栏收录该内容

6 篇文章 0 订阅

订阅专栏

文章目录

前言
一、朴素贝叶斯法
二、朴素贝叶斯法的学习和分类
三、朴素贝叶斯算法
四、贝叶斯估计
总结

前言

本文只要记录一些书中的一些小知识点，挑一些本人认为重要的地方进行总结。

各位道友！道长(zhǎng) 道长(chǎng)

一、朴素贝叶斯法

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。
首先基于特征条件独立假设学习输入输出的联合概率分布
然后基于此模型，对给定的输入x，利用贝叶斯定理求出后验概率最大的输出y。
朴素贝叶斯法实现简单，效率高，常用

二、朴素贝叶斯法的学习和分类

两个小概念：

先验概率：事情没有发生，根据经验判断结果发生的概率。由因求果
后验概率：事情已经发生，根据发生的结果，判断是什么原因引起的该结果。由果求因

已知输入空间上的随机变量X和输出空间上的随机变量Y.
先验概率分布为：
$P(Y=c_k), k=1,2...K$
( $c_k$ 为类标记)
条件概率分布为：
$P(X=x|Y=c_k)$
于是得到了联合概率分布 $P (X, Y)$
由于条件概率分布 $P(X=x|Y=c_k)$ 有指数级别的参数，于是做出了一个条件独立性的假设。
$P(X=x|Y=c_k)=\prod_{j=1}^nP(X^{(j)}|Y=c_k)$

这样，通过学习到的模型计算后验概率分布 $P(Y=c_k|X=x)$ :

$P(Y=c_k|X=x)=\frac{P(X=x|Y=c_k)P(Y=c_k)}{\sum_kP(X=x|Y=c_k)P(Y=c_k)}$
将条件独立假设带入可得
$P(Y=c_k|X=x)=\frac{P(Y=c_k) \prod_{j}P(X^{(j)}|Y=c_k)}{\sum_kP(Y=c_k)\prod_jP(X^{(j)}|Y=c_k)}$

这就是朴素贝叶斯法的基本公式，于是朴素贝叶斯分类起可以表示为：
$y=f(x)=\arg \max_{c_k} \frac{P(Y=c_k) \prod_jP(X^{(j)}|Y=c_k)}{\sum_kP(Y=c_k)\prod_jP(X^{(j)}|Y=c_k)}$
由于所有分母对于所有的 $c_k$ 都是相同的，所以只需要使分子部分极大化即可

$y=f(x)=\arg \max_{c_k} P(Y=c_k) \prod_jP(X^{(j)}=x^{(j)}|Y=c_k)$

三、朴素贝叶斯算法

输入：训练数据集 $T= {(x_1,y_1)...(x_N,y_N) }$ ；实例 $x$
输出： $x$ 的分类

（其中 $x=(x^{(1)},x^{(2)}....x^{(n)})$ ， $x_i^{(j)}$ 表示第I个样本的第j个特征。y=(c1,c2,…,cK)表示类别）

（1）计算先验概率及条件概率
先验概率的极大似然估计是：
$P(Y=c_k)=\frac{\sum_{i=1}^NI(y_i=c_k)}{N} ,k=1,2...K$
条件概率的极大似然估计是：
$P(X^{(j)}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^NI(x_i^{(j)}=a_{jl},y_i=c_k)}{\sum_{i=1}^NI(y_i=c_k)}$

（2）对于给定的 $x=(x^{(1)},x^{(2)}....x^{(n)})$ 计算
$P(Y=c_k) \prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_k)$
（3）确定x的类
$y=\arg \max_{c_k} P(Y=c_k) \prod_{j=1}^n P(X^{(j)}=x^{(j)}|Y=c_k)$

四、贝叶斯估计

在这里插入图片描述

总结

今天的内容是统计学习方法的第一章节，挺容易理解的，结合模型图理解更加方便

多吃轻食

关注

17
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
《统计学习方法》第4章朴素贝叶斯法

本文只要记录一些书中的一些小知识点，挑一些本人认为重要的地方进行总结。各位道友！道长(zhǎng) 道长(chǎng)今天的内容是统计学习方法的第一章节，挺容易理解的，结合模型图理解更加方便。
复制链接

扫一扫