统计学习方法笔记第四章朴素贝叶斯(包含Python代码)

最新推荐文章于 2024-01-25 18:15:47 发布

DouglasLikeToCode

最新推荐文章于 2024-01-25 18:15:47 发布

阅读量256

点赞数 1

分类专栏：统计学习方法 Python 新闻分类

本文链接：https://blog.csdn.net/zzl1060549268/article/details/89334524

版权

文章目录

1. 朴素贝叶斯法的学习与分类

贝叶斯法求后验概率最大的输出做为输出，是一种生成模型。

1.1 基本方法

朴素贝叶斯方法通过训练数据集学习联合概率分布 $P (X, Y)$ ,通过学习先验概率分布和条件概率分布，根据贝叶斯公式求得联合概率分布。朴素贝叶斯方法对于条件概率分布做出了条件独立性假设，即假设用于分类的特征在类确定的条件下都是条件独立的。

朴素贝叶斯法在分类时，将后验概率最大的类作为类输出，朴素贝叶斯分类器可以表示为：

$y=f(x)=arg\max_{c_k}P(Y=c_k){\prod}_jP(X^{(j)}=x^{(j)}|Y=c_k)$

1.2 后验概率最大化的含义

朴素贝叶斯方法的后验概率最大化等价于期望风险最小化。

2. 朴素贝叶斯法的参数估计

2.1 极大似然估计

朴素贝叶斯法的先验概率和条件概率应用极大似然估计计算：

$P(Y=c_k)=\frac{\sum_{i=1}^{N}I(y_i=c_k)}{N},k=1,2,\dots,K$

$P(X^{j}=a_{jl}|Y=c_k)=\frac{\sum_{i=1}^{N}I(x_i^{(j)}=a_{jl},y_i=c_k)}{\sum_{i=1}^{N}I(y_i=c_k)}$

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

DouglasLikeToCode

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python中的概率例题_统计学习方法4：朴素贝叶斯和例题Python语言实现

weixin_36070880的博客

12-24

200

#author:胤#time:2019/3/16 13:42#代码改自：https://blog.csdn.net/woai8339/article/details/82931170import numpy as npimport numpy.matlibdef data_collection(trainData,Y,input_data):'''根据输入的X Y数组，收集所有概率P的数据'''...

jieba和朴素贝叶斯实现文本分类

qq_27396789的博客

02-02

3066

#盗取男票年轻时候的代码，现在全给我教学使用了，感恩脸#分类文档为多个文件夹文件夹是以类别名命名内含多个单个文档 #coding: utf-8 from __future__ import print_function, unicode_literals import os import time import random import jieba import numpy as np

参与评论您还未登录，请先登录后发表或查看评论

《统计学习方法(第二版)》学习笔记 第四章 朴素贝叶斯法代码实现

忆殇D.Rose的博客

10-30

318

这篇博客总结一下特征值是离散值和连续值情况的朴素贝叶斯法的代码实现。在这两种情况下：特征值是离散值时，P(X(j)=ajl∣Y=ck)P(X^{(j)}=a_{jl}|Y=c_{k})P(X(j)=ajl∣Y=ck)是通过频数来估计的；特征值是连续值时，P(X(j)=ajl∣Y=ck)P(X^{(j)}=a_{jl}|Y=c_{k})P(X(j)=ajl∣Y=ck)是通过正态分布来估计的...

《统计学习方法》第四章：朴素贝叶斯 ——python实现

ACM_hades的博客

04-29

380

K近邻法理论推导:https://blog.csdn.net/ACM_hades/article/details/89677342 数据集数据集：MNIST数据，图片大小是28×28的，10个类别，使用数据的原始特征，所有每个样本有28×28=784个特征。 朴素贝叶斯比较适合特征维度较小的情况，但是MNIST数据已到达上百唯的特征,概率联乘起来超过Python float能表示的极限，由于...

朴素贝叶斯法后验概率最大化的含义

Super_jun的博客

12-01

1391

朴素贝叶斯法将实例分到后验概率最大的类中。这等价于期望风险最小化。假定选择0-1损失函数：式中是分类决策函数。这是，期望风险函数为期望是对联合分布取...

机器学习笔记--4、朴素贝叶斯及python实现

高雅的博客

04-27

1746

朴素贝叶斯 文章目录朴素贝叶斯概率基础随机事件样本空间概率联合概率条件概率独立性全概率公式贝叶斯公式朴素贝叶斯拉普拉斯平滑处理算法处理流程sklearn中的朴素贝叶斯高斯朴素贝叶斯python实现高斯朴素贝叶斯多项式朴素贝叶斯——用于文本分类 朴素贝叶斯模型（Naive Bayesian Model，NBM） 朴素贝叶斯分类器是一个以贝叶斯定理为基础的多分类的分类器。对于给定数据，首先基于特征...

《统计学习方法：李航》笔记从原理到实现（基于python）-- 第4章 朴素贝叶斯法

最新发布

weixin_42046845的博客

01-25

1406

《统计学习方法：李航》笔记从原理到实现（基于python）-- 第4章 朴素贝叶斯法

《机器学习》小白Python学习笔记（十一） ———— 朴素贝叶斯 & 半朴素贝叶斯AODE分类器 Python实现

River_J777的博客

08-05

1374

《机器学习》小白Python学习笔记（十） ———— 贝叶斯算法 & EM算法 Python实现课后题数据集朴素贝叶斯算法代码半朴素贝叶斯（AODE）分类器代码课后题试编程实现拉普拉斯修正的朴素贝叶斯分类器和半朴素贝叶斯分类器中的AODE分类器，并以⻄瓜数据集3.0为训练集，对P.151“测1”样本进⾏判别。数据集编号色泽根蒂敲声纹理脐部触感密度含糖率好瓜 0 1 青绿蜷缩浊响清晰凹陷硬滑 0.697 0.460

统计学习方法读书笔记8-朴素贝叶斯

柳杰的博客

10-21

202

文章目录1.朴素贝叶斯的基本方法2.朴素贝叶斯的参数估计1.极大似然估计2.朴素贝叶斯算法3.贝叶斯估计3.后验概率最大化-期望风险最小化4.朴素贝叶斯代码实现 1.朴素贝叶斯的基本方法 2.朴素贝叶斯的参数估计 1.极大似然估计 2.朴素贝叶斯算法 3.贝叶斯估计用极大似然估计可能出现所要估计的概率值为0的情况，这是会影响到后验概率的计算结果，使分类产生偏差。解决这一问题的方法就是采用贝叶斯估计，原理是在分子、分母中加上指定数值，使得不同项之间大小关系不变，，但消除了分母为0的可能性

统计学习方法第四章笔记——朴素贝叶斯

02-29

1274

4.1 模型介绍　　模型的输入空间为χ∈Rnχ∈R^n的nn维向量，输出空间为类标记集合y={c1,c2,…ck}y=\{c_1,c_2,…c_k\}，XX是定义在χχ上的随机变量，YY是定义在yy上的随机变量，P(X,Y)P(X,Y)是XX和YY的联合分布，训练数据集T={(x1,y1),(x2,y2),…(xn,yn)}T=\{(x_1,y_1 ),(x_2,y_2 ),…(x_n,y_n)\}

《机器学习实战》个人学习记录笔记（九）———朴素贝叶斯之新浪新闻分类(Sklearn)

qq_41010142的博客

04-16

917

第四章 朴素贝叶斯PS：个人笔记根据《机器学习实战》这本书，Jack-Cui的博客，以及深度眸的视频进行学习1 中文语句切分import os import jieba def TextProcessing(folder_path): folder_list = os.listdir(folder_path) #查看folder_path...

朴素贝叶斯算法实现新闻分类（Sklearn实现）

热门推荐

Asia-Lee

08-01

1万+

目录 1、朴素贝叶斯实现新闻分类的步骤 2、代码实现 1、朴素贝叶斯实现新闻分类的步骤（1）提供文本文件，即数据集下载（2）准备数据将数据集划分为训练集和测试集；使用jieba模块进行分词，词频统计，停用词过滤，文本特征提取，将文本数据向量化停用词文本stopwords_cn.txt下载 jieba模块学习：https:...

Tensorflow入门5-Mnist手写数字识别（CNN）

AI_JOKER的博客

09-11

646

一、mnist数据集下载链接：https://pan.baidu.com/s/1cqLjY790dzJXr1My6Yt4VQ 提取码：nobn 将数据集放在项目文件夹下，每次运行无需下载，节省时间使用下面语句调用mnist数据集 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data ...

机器学习实战--朴素贝叶斯算法

xue_csdn的博客

03-19

315

朴素贝叶斯算法——实现新闻分类（Sklearn实现）转自：https://blog.csdn.net/asialee_bird 1、朴素贝叶斯实现新闻分类的步骤（1）提供文本文件，即数据集下载（2）准备数据将数据集划分为训练集和测试集；使用jieba模块进行分词，词频统计，停用词过滤，文本特征提取，将文本数据向量化停用词文本stopword...

朴素贝叶斯算法原理与Python实现

apollo_miracle的博客

06-05

5214

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法[1]。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型（Naive Bayesian Model，NBM）。和决策树模型相比，朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论，有着坚实的数学基础，以及稳定的分类效率。同时，NBC模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单。理论上，NBC模型与其他分类方法相比具有最小的误差率。但是实际上并...

机器学习笔记（五）续——朴素贝叶斯算法的后验概率最大化含义

chunyun0716的专栏

04-04

5475

上一节中讲了朴素贝叶斯算法将实例分到后验概率最大的类。这等价于期望风险最小化。假设使用0-1损失函数： L(Y,f(X))={1,0,Y≠f(X)Y=f(X) L(Y, f(X)) = \Bigg\{ \begin{array} {ll} 1, & Y \neq f(X) \\ 0, & Y = f(X) \end{array} 上式中的f(x)f(x)是分类

NNPR-Chap1 统计模式识别（10）风险最小化

weixin_30872867的博客

08-09

139

错分概率最小化原则并不适用于所有问题。像前面介绍的判断医学图像是否为癌症的例子，将癌症图像判定为正常带来的后果远远大于将正常图像误分为癌症。为此，引入损失矩阵（loss matrix），其元素代表将类j误分为类k时的惩罚。从而有，某类的期望损失　　　总的期望损失（2）当式2中被积函数在每个点上都取最小值时，总的期望损失最小（即风险最小）。其实...

统计学习方法第四章朴素贝叶斯的贝叶斯估计，例题4.2代码实践

GrinAndBearIt的博客

01-12

2934

统计学习方法第四章朴素贝叶斯的贝叶斯估计，例题4.2代码实践（如需要查看极大似然估计的算法请看我的另一篇文章http://blog.csdn.net/grinandbearit/article/details/79044065），贝叶斯算法略微复杂了点对分子分母做了矫正防止出现乘0现象 #-*- coding:utf-8 -*- from numpy import * #将书上的数据输入，

朴素贝叶斯分类方法详解：从理论到Python实践

"《机器学习实战》第四章深入探讨了基于概率论的分类方法，特别是朴素贝叶斯算法。这份学习笔记涵盖了从贝叶斯决策理论基础到实际应用的完整过程，包括条件概率、贝叶斯准则以及如何利用这些概念进行分类。资源还...