概率基础
概率就是定义一件事情发生的可能性。
所谓的朴素,就是加了一个假设:特征与特征之间是相互独立的。
朴素贝叶斯:朴素+贝叶斯
朴素:特征与特征之间是相互独立的
贝叶斯:就是贝叶斯算法
应用场景:文本分类
单词作为特征
20类新闻分类
1)获取数据
2)划分数据集
3)特征工程
文本特征抽取
4)朴素贝叶斯预估器流程
5)模型评估
朴素贝叶斯算法总结
优点:
朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率
对缺失数据不太敏感,算法也比较简单,常用于文本分类
分类准确度高,速度快
缺点:
由于使用了样本独立性的假设,所以如果特征属性有关联时其效果不好