[阅读笔记]《统计学习方法》李航著:Chp4 朴素贝叶斯法
本章概要
4.1 朴素贝叶斯法的学习与分类
- 一重要假设前提:训练数据集是独立同分布产生的
- 另一重要假设:条件独立性假设
- 朴素贝叶斯的原理——后验概率最大化等价于期望风险最小化
4.2 朴素贝叶斯法的参数估计
- 极大似然估计:直接统计频数
- 贝叶斯估计
Why:因为极大似然估计可能会出现所要估计的概率值为0的情况,影响到后验概率的计算结果,进而使分类产生偏差
What:在频数上增加一个正数 λ λ ,该值为0时为极大似然估计,为1时称为拉普拉斯平滑