DataWhale NLP 打卡（五）朴素贝叶斯

最新推荐文章于 2022-07-25 10:54:48 发布

AngelaOrange

最新推荐文章于 2022-07-25 10:54:48 发布

阅读量187

点赞数

分类专栏： NLP自然语言处理

NLP自然语言处理专栏收录该内容

18 篇文章 1 订阅

订阅专栏

朴素贝叶斯（naive bayes）法是基于贝叶斯定理与特征条件独立假设的分类方法。

优点：在数据较少的情况下仍然有效，可以处理多分类问题。
缺点：对入输入数据的准备方式较为敏感。
使用数据类型：标称型数据。
下面从一个简单问题出发，介绍怎么使用朴素贝叶斯解决分类问题。
一天，老师问了个问题，只根据头发和声音怎么判断一位同学的性别。
为了解决这个问题，同学们马上简单的统计了7位同学的相关特征，数据如下：

头发声音性别
长粗男
短粗男
短粗男
长细女
短细女
短粗女
长粗女
长粗女
这个问题之前用决策树做过了，这里我们换一种思路。
要是知道男生和女生头发长短的概率以及声音粗细的概率，我们就可以计算出各种情况的概率，然后比较概率大小，来判断性别。
假设抽样样本足够大，我们可以近似认为可以代表所有数据，假设上位7位同学能代表所有数据，这里方便计算~
由这7位同学，我们马上得出下面表格概率分布。

性别头发长声音粗
男 1/3 1
女 3/5 3/5
假设头发和声音都是独立特征，于是
男生头发长声音粗的概率=3/81/31=1/8
女生头发长声音粗的概率=5/83/53/5=9/40
因为1/8<9/40所以如果一个人，头发长，声音粗，那么这个人更可能是女生，于是出现这些特征就是女生。其他特征依次类推。
这就是朴素贝叶斯分类方法。是的，就是这么简单。
下面来解释原理，先看贝叶斯公式：
这里写图片描述

参考文献：
https://blog.csdn.net/qq_36671300/article/details/89306309

AngelaOrange

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DataWhale NLP 打卡（五）朴素贝叶斯

朴素贝叶斯（naive bayes）法是基于贝叶斯定理与特征条件独立假设的分类方法。优点：在数据较少的情况下仍然有效，可以处理多分类问题。缺点：对入输入数据的准备方式较为敏感。使用数据类型：标称型数据。下面从一个简单问题出发，介绍怎么使用朴素贝叶斯解决分类问题。一天，老师问了个问题，只根据头发和声音怎么判断一位同学的性别。为了解决这个问题，同学们马上简单的统计了7位同学的相关特征，数据...
复制链接

扫一扫

专栏目录