高斯贝叶斯分类器_【Python数据科学手册】专题：朴素贝叶斯分类

最新推荐文章于 2024-06-13 14:47:12 发布

醉卧长风

最新推荐文章于 2024-06-13 14:47:12 发布

阅读量1k

点赞数

文章标签：高斯贝叶斯分类器

本文链接：https://blog.csdn.net/weixin_32417571/article/details/113331368

版权

朴素贝叶斯模型是一组非常简单快速的分类算法，通常适用于维度非常高的数据集。因为运行速度快，而且可调参数少，因此非常适合为分类问题提供快速粗糙的基本方案。1

贝叶斯分类

朴素贝叶斯分类器建立在贝叶斯分类方法的基础上，其数学基础是贝叶斯定理(Bayes’s theorem)——一个描述统计量条件概率关系的公式。在贝叶斯分类中，我们希望确定一个具有某些特征的样本属于某类标签的概率，通常记为P(L|特征)

假如需要确定两种标签，定义为L1 和L2，一种方法就是计算这两个标签的后验概率的比值：

现在需要一种模型，帮我们计算每个标签的P ( 特征 | Li)。这种模型被称为生成模型，因为它可以训练出生成输入数据的假设随机过程(或称为概率分布)。为每种标签设置生成模型是贝叶斯分类器训练过程的主要部分。

之所以称为“朴素”或“朴素贝叶斯”，是因为如果对每种标签的生成模型进行非常简单的假设，就能找到每种类型生成模型的近似解，然后就可以使用贝叶斯分类。

首先导入需要用的程序库：

%matplotlib inlineimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns; sns.set()

高斯朴素贝叶斯

最容易理解的朴素贝叶斯分类器可能就是高斯朴素贝叶斯(Gaussian naive Bayes)

假设每个标签的数据都服从简单的高斯分布。假如你有下面的数据

from sklearn.datasets import make_blobsX, y = make_blobs(100, 2, centers=2, random_state=2, cluster_std=1.5)plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='RdBu');

一种快速创建简易模型的方法就是假设数据服从高斯分布，且变量无协方差(no covariance，指线性无关)。只要找出每个标签的所有样本点均值和标准差，再定义一个高斯分布，就可以拟合模型了。

最低0.47元/天解锁文章

醉卧长风

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
高斯贝叶斯分类器_【Python数据科学手册】专题：朴素贝叶斯分类

朴素贝叶斯模型是一组非常简单快速的分类算法，通常适用于维度非常高的数据集。因为运行速度快，而且可调参数少，因此非常适合为分类问题提供快速粗糙的基本方案。1贝叶斯分类朴素贝叶斯分类器建立在贝叶斯分类方法的基础上，其数学基础是贝叶斯定理(Bayes’s theorem)——一个描述统计量条件概率关系的公式。在贝叶斯分类中，我们希望确定一个具有某些特征的样本属于某类标签的概率，通常记为P(L|...
复制链接

扫一扫