目录
学习完机器学习实战的朴素贝叶斯,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。
所有代码和数据可以访问 我的 github
如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~
0. 前言
贝叶斯算法,是一类基于概率论的分类方法。朴素贝叶斯(Naive Bayes),是采取了贝叶斯最原始、最简单的假设的算法。
朴素贝叶斯算法给出实例属于各个类别的概率,然后选择概率最大的一类。贝叶斯决策理论的核心思想是选择具有最高概率的决策。
- 优点:在数据较少的情况下,仍然十分有效果
- 缺点:对于输入数据的准备方式比较敏感
- 适用数据类型:标称型数据
朴素贝叶斯假设:
- 所有特征都是独立的(即每个特征出现的可能性与其他特征无关)
- 每个特征都是同等重要的
1. 条件概率
称为事件 的概率。 称为在事件 发生的情况下,事件 的概率,这就是条件概率。根据概率论,给出以下的定义:
为了计算 ,我们可以设法通过计算 来得到。
2. 朴素贝叶斯(Naive Bayes)
假设类别为 ,测试样本为 ,要计算