朴素贝叶斯
朴素贝叶斯
通过对目标数据计算概率,选择概率最大的分类。算法需要一个先验输入,例如邮件分类系统中需要对此前收到的邮件进行统计算垃圾邮件的占比
优点
在数据较少的情况下仍然有效,可以处理多类别问题
缺点
对于输入数据的准备方式较为敏感
适用数据类型
标称型数据
一般过程
- 收集数据
- 准备数据:需要数值或者布尔型数据
- 分析数据:有大量特征时绘制特征作用不大,此时使用直方图效果更好
- 训练算法:计算不同的独立特征的条件概率
- 测试算法:计算算法错误率
- 使用算法:一个常见的朴素贝叶斯应用是文档分类。可以在任意的分类场景中使用朴素贝叶斯分类器,不一定非要文本