[机器学习] 朴素贝叶斯分类

最新推荐文章于 2022-04-15 18:10:57 发布

番茄牛腩煲

最新推荐文章于 2022-04-15 18:10:57 发布

阅读量413

收藏

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cumina/article/details/104533322

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

贝叶斯决策理论

一个数据集，分为两类，其中每个样本的分类我们都已知晓
在这里插入图片描述
一个新的点 $(x, y)$ ，其分类未知。
按照什么方式来决定将这个点分到一类中呢？我们提出如下规则：

如果 $p_1(x,y)>p_2(x,y)$ ，则 $(x, y)$ 为红色（ $p_1$ ）一类。
如果 $p_2(x,y)>p_1(x,y)$ ，则 $(x, y)$ 为蓝色（ $p_2$ ）一类。

贝叶斯决策理论核心思想：选择具有最高概率的决策。

朴素贝叶斯分类

正式定义

设 $x =$ { $a_1, a_2,...,a_m$ } 为一个待分类项， $a_i$ 为 $x$ 的每一个特征属性
有类别集合 $C =$ { $y_1, y_2,...,y_n$ }
计算 $p(y_1|x),p(y_2|x),...,p(y_n|x)$
如果 $p(y_k|x)=max$ { $p(y_1|x),p(y_2|x),...,p(y_n|x)$ }，则 $x\in$ $y_k$

朴素贝叶斯假设：假设待分类项中所有特征属性相互条件独立

在这里插入图片描述
分母对于所有类别为常数，且各特征属性是条件独立的，故有：

拉普拉斯修正：为避免其他属性携带的信息被训练集中未出现的属性值“抹去”，在估计概率值时要进行“平滑”处理。

NBC模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单。

理论上，NBC模型与其他分类方法相比具有最小的误差率。但事实上并非总是如此，因为NBC模型假设属性之间相互独立，这个假设在实际应用中往往是不成立的，这给NBC模型的正确分类带来了一定影响。

自然语言讲究上下文，故假设中的相对独立一般不会存在。

但它仍是最常用、应用最广泛的分类算法之一

贝叶斯信念网

一些变量相关，另一些变量则相互独立

朴素贝叶斯是贝叶斯信念网的一个简单特例。

番茄牛腩煲

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值