高斯贝叶斯分类器_【Python数据科学手册】专题:朴素贝叶斯分类

朴素贝叶斯模型是一组非常简单快速的分类算法,通常适用于维度非常高的数据集。因为运行速度快,而且可调参数少,因此非常适合为分类问题提供快速粗糙的基本方案。1

贝叶斯分类

朴素贝叶斯分类器建立在贝叶斯分类方法的基础上,其数学基础是贝叶斯定理(Bayes’s theorem)——一个描述统计量条件概率关系的公式。在贝叶斯分类中,我们希望确定一个具有某些特征的样本属于某类标签的概率,通常记为P(L|特征)

703d62c2ac40d7892f1c7966636a5c21.png

假如需要确定两种标签,定义为L1 和L2,一种方法就是计算这两个标签的后验概率的比值:

78e1a9e5aacdefdae0a361cdbf63aaea.png

现在需要一种模型,帮我们计算每个标签的P ( 特征 | Li)。这种模型被称为生成模型,因为它可以训练出生成输入数据的假设随机过程(或称为概率分布)。为每种标签设置生成模型是贝叶斯分类器训练过程的主要部分。

之所以称为“朴素”或“朴素贝叶斯”,是因为如果对每种标签的生成模型进行非常简单的假设,就能找到每种类型生成模型的近似解,然后就可以使用贝叶斯分类。

首先导入需要用的程序库:

%matplotlib inlineimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns; sns.set()

2

高斯朴素贝叶斯

最容易理解的朴素贝叶斯分类器可能就是高斯朴素贝叶斯(Gaussian naive Bayes)

假设每个标签的数据都服从简单的高斯分布。假如你有下面的数据

from sklearn.datasets import make_blobsX, y = make_blobs(100, 2, centers=2, random_state=2, cluster_std=1.5)plt.scatter(X[:, 0], X[:, 1], c=y, s=50, cmap='RdBu');
d65b888fa16342df91c4949a86ca60ec.png

一种快速创建简易模型的方法就是假设数据服从高斯分布,且变量无协方差(no covariance,指线性无关)。只要找出每个标签的所有样本点均值和标准差,再定义一个高斯分布,就可以拟合模型了。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
高斯朴素贝叶斯分类是一种基于概率统计的分类算法,在Python中有多种实现方法。其中一种实现方法可以在的博客文章中找到,该文章介绍了高斯朴素贝叶斯分类的原理和Python实现。另外,在的文章中也介绍了Python实现的朴素贝叶斯分类,并给出了具体的定义和使用技巧。 高斯朴素贝叶斯分类的原理是基于概率论中的贝叶斯定理,通过计算样本的概率来进行分类。在该分类中,假设每个特征的概率分布都服从高斯分布,即正态分布。具体来说,对于每个特征,根据训练数据计算出每个类别下该特征的均值和方差,然后通过高斯分布公式计算出样本在每个类别下的概率,最后根据概率大小进行分类。 高斯朴素贝叶斯分类的优点包括:简单、速度快、对于多分类问题有效、在分布独立的假设成立的情况下,效果较好。与逻辑回归相比,需要的样本量更少一些,并且对于类别型特征效果非常好。 然而,高斯朴素贝叶斯分类也存在一些缺点。例如,如果测试集中的某个类别变量特征在训练集中没有出现过,直接计算概率时会得到0,导致预测功能失效。为了解决这个问题,可以使用平滑技术,如拉普拉斯估计。此外,高斯朴素贝叶斯分类假设特征之间是独立的,在现实生活中这种假设很难成立。 高斯朴素贝叶斯分类在文本分类、垃圾文本过滤、情感分析等场景中应用广泛。对于文本相关的多分类实时预测,由于其简单和高效的特点,也被广泛应用。此外,高斯朴素贝叶斯分类和协同过滤是推荐系统中常用的组合,能够增强推荐的覆盖度和效果。 综上所述,高斯朴素贝叶斯分类Python中有多种实现方法,可以根据具体的需求选择适合的方法进行使用。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [【概率图模型】(一)高斯朴素贝叶斯分类(原理+python实现)](https://blog.csdn.net/u013066730/article/details/125821190)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Python实现的朴素贝叶斯分类示例](https://download.csdn.net/download/weixin_38721565/12871135)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值