目录
1 朴素贝叶斯法的学习与分类
1.1 基本方法
假设训练数据集 由 独立同分布产生
(1)学习先验概率分布
(2)学习条件概率分布
(3)于是学习到联合概率分布
- 朴素贝叶斯法对条件概率分布作了条件独立性的假设。由于这是一个较强的假设,朴素贝叶斯法也由此得名。具体地,条件独立性假设是:
即每个特征相互独立
- 朴素贝叶斯分类器可表示为:
1.2 后验概率最大化的含义
后验概率最大化 <=> 期望风险最小化
2 朴素贝叶斯法的参数估计
2.1 极大似然估计
在朴素贝叶斯法中,学习意味着估计 和 ,可以应用极大似然估计法来估计相应的概率
- 先验概率 的极大似然估计是:
- 设第 j 个特征x(j) 可能取值的集合为{aj1,aj2...ajSj},条件概率的极大似然估计是:
2.2 贝叶斯估计法
用极大似然估计可能会出现所要估计的概率值为 0 的情况。这时会影响到后验概率的计算结果,使分类产生偏差。解决这一问题的方法是采用贝叶斯估计。具体地,条件概率的贝叶斯估计是:
式中 .
- 时就是极大似然估计
- 时就是拉普拉斯平滑
例题