机器学习算法（二）: 朴素贝叶斯(Naive Bayes)

最新推荐文章于 2022-07-27 16:31:00 发布

Alisa_2018

最新推荐文章于 2022-07-27 16:31:00 发布

阅读量209

点赞数

分类专栏：机器学习文章标签：机器学习 python 算法

本文链接：https://blog.csdn.net/Alisa_2018/article/details/111769665

版权

机器学习算法（二）: 朴素贝叶斯(Naive Bayes)

1. 实验室介绍
1.1 实验环境
1. python3.7
2. numpy >= ‘1.16.4’
3. sklearn >= ‘0.23.1’
1.2 朴素贝叶斯的介绍
朴素贝叶斯算法（Naive Bayes, NB) 是应用最为广泛的分类算法之一。它是基于贝叶斯定义和特征条件独立假设的分类器方法。由于朴素贝叶斯法基于贝叶斯公式计算得到，有着坚实的数学基础，以及稳定的分类效率。NB模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单。当年的垃圾邮件分类都是基于朴素贝叶斯分类器识别的。
什么是条件概率，我们从一个摸球的例子来理解。我们有两个桶：灰色桶和绿色桶，一共有7个小球，4个蓝色3个紫色，分布如下图：
在这里插入图片描述
p(A,B)：表示事件A和事件B同时发生的概率。
p(B)：表示事件B发生的概率，叫做先验概率；p(A)：表示事件A发生的概率。
p(A|B)：表示当事件B发生的条件下，事件A发生的概率叫做后验概率。
p(B|A)：表示当事件A发生的条件下，事件B发生的概率。
我们用一句话理解贝叶斯：世间很多事都存在某种联系，假设事件A和事件B。人们常常使用已经发生的某个事件去推断我们想要知道的之间的概率。例如，医生在确诊的时候，会根据病人的舌苔、心跳等来判断病人得了什么病。对病人来说，只会关注得了什么病，医生会通道已经发生的事件来确诊具体的情况。这里就用到了贝叶斯思想，A是已经发生的病人症状，在A发生的条件下是B_i的概率。

1.3 朴素贝叶斯的应用
朴素贝叶斯算法假设所有特征的出现相互独立互不影响，每一特征同等重要，又因为其简单，而且具有很好的可解释性一般。相对于其他精心设计的更复杂的分类算法，朴素贝叶斯分类算法是学习效率和分类效果较好的分类器之一。朴素贝叶斯算法一般应用在文本分类，垃圾邮件的分类，信用评估，钓鱼网站检测等。

Step1:库函数导入

import warnings
warnings.filterwarnings('ignore')
import numpy as np
# 加载莺尾花数据库
from sklearn import datasets
# 导入高斯朴素贝叶斯分类器
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split

Step2：数据导入&分析

X,y

最低0.47元/天解锁文章

Alisa_2018

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法（二）: 朴素贝叶斯(Naive Bayes)

机器学习算法（二）: 朴素贝叶斯(Naive Bayes)1. 实验室介绍1.1 实验环境1. python3.72. numpy >= ‘1.16.4’3. sklearn >= ‘0.23.1’1.2 朴素贝叶斯的介绍朴素贝叶斯算法（Naive Bayes, NB) 是应用最为广泛的分类算法之一。它是基于贝叶斯定义和特征条件独立假设的分类器方法。由于朴素贝叶斯法基于贝叶斯公式计算得到，有着坚实的数学基础，以及稳定的分类效率。NB模型所需估计的参数很少，对缺失数据不太敏感，算法也
复制链接

扫一扫