朴素贝叶斯

贝叶斯:Thomas Bayes 贝叶斯是18世纪英国数学家,他原本是一位神父,主要研究的是概率统计。其发明贝叶斯公式的初衷也是为了证明上帝的存在。没想到上帝没找到,却让人类找到了人工智能。

贝叶斯公式的基本理念是,如何通过现象来做出预测,从而形成判断。这几乎就构成了人工智能的基础。

简单来说是,通过先验概率+数据导出后验概率,然后选择最大似然估计。

后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,

先验概率:事情还没有发生,要求这件事情发生的可能性的大小

最大似然估计:在已经得到实验结果的情况下(可以理解为已经计算出了一篇文档属于每个类的后验概率),那么我们选择后验概率最大的一项,并且为文档贴上对应类的类标签

贝叶斯公式: 

简单来说是A在B的条件概率,为什么不直接用先验概率的原因是因为,我们要做的是预测,而不是已知数据的统计。

就像我们看赌神电影时候,主角的牌只显示了一部分,后面的摄像头通过这个部分对他的这张牌是什么做了预测。这就是系统根据新现象对结果的预测,如果牌再多显示一部分,那么结果的预测便会更准确。

举个栗子:

想象这么一个场景......

你开着车,快速地往下一个路口驶去,你知道,到了下一个路口就要右转了。

【这件事情很简单,坐在驾驶室内,看到下一个路口,往右边打方向盘就好了】

突然,前挡风玻璃碎了......

此刻,你已经无法看清前面的路了,这时候,你该怎样才能知道什么时候右转?

还好,你是一位数学家,

智商及时上线...

数学家根据自己的经验,

估计这条笔直的道路上5%是十字路口,95%是笔直大路。

这也就意味着如果随意的右转,有 95% 的概率是错误的。

数学家从后视镜看出去,发现后面有一辆车在打右转弯灯,他意识到:25%的人会在十字路口打右转灯

新的信息出现了,此时如果右转,错误的概率就比之前小很多。

这种思考方法,就是 贝叶斯定理 所阐述的思考方法。

 

贝叶斯求的是P(结果i|特征),然后求得概率最大的Ci。

为什么不求P(特征|结果i),是因为既然要比概率大小,那么条件概率中的条件肯定是要相同才能对比。所以条件是特征(这是我们输入的只有一个,而结果有n个)

朴素贝叶斯法对条件概率分布做了条件独立性的假设,由于这是一个较强的假设,朴素贝叶斯也由此得名!

条件独立表明P(特征1,特征2,特征3|结果1)=P(特征1|结果1)*P(特征2|结果1)*P(特征3|结果1),至于为什么不直接统计数据中的特征全满足概率:在结果1中特征1&特征2&特征3的概率,是如果数据稀疏性,很容易统计到0的情况。 这样是不合适的。

至此概率可求

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值