朴素贝叶斯

用途:

解决多分类问题。训练集(xi,yi),xij 在某个特征中取值,yi是分类结果。

缺点:

1.假设了条件独立,即假设xi中每个元素xij的选取都不受其他xij的影响,而这会牺牲分类准确率。
2.无法处理隐变量(无法直接观测的变量)。

算法:

这里写图片描述
其中 I(yi=ck)是指 if yi==ck return 1 else return 0;
N是训练集的数据条数
为了避免P的计算中出现0的情况,可以在分子和分母上都加一个正数
这里写图片描述
其中,Sj是该xj特征下的值的个数

原理

利用了贝叶斯定理
这里写图片描述
累乘项 是 X取x (x1,x2…..xn)时,y=ck的概率P(y=ck,X=x)
分母是p(X=x) 对于所有的ck 值都是相同的
故实际上通过输入的X=x,获得
这里写图片描述
使分子最大化的ck的取值 也就是y的分类结果

最终,可以通过上式获取 X=x是 y的所有取值的y值,取其中最大的即为输出。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值