sklearn-分类算法-朴素贝叶斯

本文介绍了朴素贝叶斯分类算法在文本分类,如垃圾邮件识别中的应用。核心思想是计算预测样本属于各类别的概率,并选择概率最大的类别作为预测结果。在 sklearn 中,朴素贝叶斯算法可以通过拉普拉斯平滑系数调整概率估计,通常α取1。通过比较类别的概率分母,可以简化计算。最后提到了使用sklearn库进行预测的API。
摘要由CSDN通过智能技术生成
朴素贝叶斯 :

适用于 文本分类,垃圾邮件识别等

思想:计算出 预测样本属于 , 每一种类别分别的概率,然后取概率最大的类别 作为预测类别

在这里插入图片描述

在这里插入图片描述

朴素贝叶斯公式
在这里插入图片描述
C:代表类别class,例如科技类
W:预测文档提取出的关键词 w1```````wn

P(属于科技概率|预测文档的特征值)


=[ p(出现预测文档多个特征值的概率|科技类文档条件下)p(科技类文章占全部文档的概率) ] / p(预测文档出现这些特征值的概率)

=【p(出现预测文档特征值词语1的概率|科技类文档的条件下)
p(出现预测文档特征值词语2的概率|科技类文档的条件下)*……… p(特征值词语n的概率|科技类文档的条件下)】*p(科技类文章占全部文档的概率) / p(预测文档出现这些特征值的概率)



朴素贝叶斯 求每个类别的概率的时候,分母都是相同的 (该文章出现这些关键词的概率

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值