贝叶斯:Thomas Bayes 贝叶斯是18世纪英国数学家,他原本是一位神父,主要研究的是概率统计。其发明贝叶斯公式的初衷也是为了证明上帝的存在。没想到上帝没找到,却让人类找到了人工智能。
贝叶斯公式的基本理念是,如何通过现象来做出预测,从而形成判断。这几乎就构成了人工智能的基础。
简单来说是,通过先验概率+数据导出后验概率,然后选择最大似然估计。
后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小,
先验概率:事情还没有发生,要求这件事情发生的可能性的大小
最大似然估计:在已经得到实验结果的情况下(可以理解为已经计算出了一篇文档属于每个类的后验概率),那么我们选择后验概率最大的一项,并且为文档贴上对应类的类标签
贝叶斯公式:
简单来说是A在B的条件概率,为什么不直接用先验概率的原因是因为,我们要做的是预测,而不是已知数据的统计。
就像我们看赌神电影时候,主角的牌只显示了一部分,后面的摄像头通过这个部分对他的这张牌是什么做了预测。这就是系统根据新现象对结果的预测,如果牌再多显示一部分,那么结果的预测便会更准确。
举个栗子:
想象这么一个场景......
你开着车,快速地往下一个路口驶去,你知道,到了下一个路口就要右转了。
【这件事情很简单,坐在驾驶室内,看到下一个路口,往右边打方向盘就好了】
突然,前挡风玻璃碎了......
此刻,你已经无法看清前面的路了,这时候,你该怎样才能知道什么时候右转?
还好,你是一位数学家,
智商及时上线...
数学家根据自己的经验,
估计这条笔直的道路上5%是十字路口,95%是笔直大路。
这也就意味着如果随意的右转,有 95% 的概率是错误的。
数学家从后视镜看出去,发现后面有一辆车在打右转弯灯,他意识到:25%的人会在十字路口打右转灯
新的信息出现了,此时如果右转,错误的概率就比之前小很多。
这种思考方法,就是 贝叶斯定理 所阐述的思考方法。
贝叶斯求的是P(结果i|特征),然后求得概率最大的Ci。
为什么不求P(特征|结果i),是因为既然要比概率大小,那么条件概率中的条件肯定是要相同才能对比。所以条件是特征(这是我们输入的只有一个,而结果有n个)
朴素贝叶斯法对条件概率分布做了条件独立性的假设,由于这是一个较强的假设,朴素贝叶斯也由此得名!
条件独立表明P(特征1,特征2,特征3|结果1)=P(特征1|结果1)*P(特征2|结果1)*P(特征3|结果1),至于为什么不直接统计数据中的特征全满足概率:在结果1中特征1&特征2&特征3的概率,是如果数据稀疏性,很容易统计到0的情况。 这样是不合适的。
至此概率可求