贝叶斯算法

山人自有锦囊妙计

于 2018-10-10 17:28:35 发布

阅读量254

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20386411/article/details/82999552

版权

机器学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

贝叶斯算法

笔试遇到的概率题目就是出自此处（好好去理解透彻）

逆概问题

实现不知道分布，根据多次的实验可以反推出分布

公式推导：

问题来了，如果不知道学校总人数U，怎么处理，贝叶斯公式就是说了概率的计算与总人数U值无关，分子分母均有，被约掉

由上可以推导出贝叶斯公式：

实例一：单词纠错，纠正为那个单词的问题

获取一个语料库：包含大量的重复单词，可以计算出现单词the或者than的概率多大（这就是先验概率，从自己已有的语料库中可以推断出来）

统计词频：统计语料库中每个单词出现的次数

实例二：垃圾邮件过滤

垃圾邮件和正常邮件的概率事先知道（先验概率），比如通常情况下，1万封邮件，正常邮件9000份，垃圾邮件1000份

P(D|h+)表示将垃圾邮件判断成邮件D的概率（垃圾邮件和D中的邮件单词相同）

在判断邮件是正常邮件还是垃圾邮件的过程中同时除了P(D)，所以可以直接将P(D)去掉

求P(D|h+)

P(D|h+)的转化/贝叶斯问题转换成朴素贝叶斯问题：

朴素：假设特征之间互不影响，因此P(d2|d1,h+)化简为P(d2|h+)。实际还是有影响的，但是这个影响相对于能把结果求解出来还是可以忽略的

是垃圾邮件，并且出现单词d1的情况下，出现d2的概率→是垃圾邮件的情况下，出现d2的概率

因为特征d1不会影响到d2，所以直接将d1去掉了

选1000封垃圾邮件，分别统计出现d1，d2，d3...的概率

山人自有锦囊妙计

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

山人自有锦囊妙计

博客等级

码龄10年

107
原创

217
点赞

1309
收藏

279
粉丝

关注

私信

热门文章

分类专栏

最新评论

CSI信号的处理
小浪子是无敌的: 你好，博主，只对幅值进行了操作吗？没有对相位进行操作吗？
CSI信号的处理
云影寒: 博主您好，感谢您的分享，请问是否可以提供一份代码，谢谢，QQ邮箱：2377019790@qq.com
CSI信号的处理
炸膛坦客: 作者大大，代码能发我一份吗？邮箱：1241551712@qq.com
CSI信号的处理
fgd0707: 你好作者大大，运行csi数据处理的matlab脚本报这个错：Subscripted assignment dimension mismatch. Error in untitled (line 13) first_ant_csi(:,i) = csi1(:,1); %直接取第一列数据(不需要for循环取)
CSI信号的处理
weixin_53756311: 我想问问这个相位怎么提取呢，有大佬会吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。