机器学习读书笔记之贝叶斯分类

本文是关于机器学习中贝叶斯分类的读书笔记,涵盖了贝叶斯决策论、极大似然估计、朴素贝叶斯分类器、半朴素贝叶斯分类器、贝叶斯网和EM算法等内容。通过解释概念、公式和应用,详细阐述了贝叶斯方法在分类问题中的作用和计算过程。
摘要由CSDN通过智能技术生成

这篇读书笔记之所以拖了很久还是因为对概率和统计的知识不够熟悉,考研的时候考的数学二,不考概率论,就只复习了高数和线代,所以用了很多时间去补上概率统计的知识,资料包括统计学习方法、ISL和一些CSDN上的博客,我尽量结合这些内容按照西瓜书的顺序写下这篇笔记。

目录

1.贝叶斯决策论
2.极大似然估计
3.朴素贝叶斯分类器
4.半朴素贝叶斯分类器
5.贝叶斯网
6.EM算法

1.贝叶斯决策论

两句话加一个公式描述什么是贝叶斯决策论(Bayesian decision theory)。

两句话:贝叶斯决策论就是基于概率和误判损失选择最优类别标记。获得概率的方法就是把对后验概率的求解转换为对类先验概率和类条件概率的求解。

一个公式:
一个公式:
其中P(c|x)是学习的目标后验概率,P(c)是先验概率,P(x|c)是类条件概率。

先验(prior)概率P(c)的求解方法很简单,就是每种类别的样本在数据集中所占的比例。

类条件概率(class-conditional probability)P(x|c)可以通过极大似然估计来进行求解。

2.极大似然估计

在讨论极大似然估计(Maximum Likelihood Estimation)之前,一句话带过为什么要求最大的后验概率(或最大的类条件概率)。根据《统计学习方法》,因为朴素贝叶斯法会将实例分到后验概率最大的类别中,为了使误判风险最小化,就要使该后验概率尽可能最大,即由期望风险最小化准则得到后验概率最大化准则。

为了求出最大的后验概率(根据贝叶斯决策论,在最大似然估计中实际上是求最大的类条件概率),我们假设类条件概率服从某种确定的概率分布形式,再对参数进行估计。假设P(x|c)被参数 θ \theta

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值