《Python机器学习及实践:从零开始通往Kaggle竞赛之路》第2章 基础篇 学习笔记(三)2.1.1.3朴素贝叶斯总结

本文是《Python机器学习及实践》书中关于朴素贝叶斯的学习笔记,主要介绍了朴素贝叶斯模型的定义、数据描述,通过20类新闻文本数据进行实践操作,包括数据分割、模型训练和性能测评,结果显示朴素贝叶斯分类器在文本分类任务上表现出约84%的准确性。
摘要由CSDN通过智能技术生成

目录

2.1.1.3朴素贝叶斯

1、模型介绍

(1)朴素贝叶斯的定义

(2)朴素贝叶斯模型

2、数据描述

(1)20类新闻文本数据背景

(2)20类新闻文本数据细节

(3)20类新闻文本数据分割

3、编程实践

4、性能测评

5、特点分析


2.1.1.3朴素贝叶斯

1、模型介绍

(1)朴素贝叶斯的定义

朴素贝叶斯是一个非常简单,但是实用性很强的分类模型。不过,和两个基于线性假设的模型(线性分类器和支持向量机分类器)不同,朴素贝叶斯分类器的构造基础是贝叶斯理论

朴素贝叶斯分类器会单独考量每一维度特征被分类的条件概率,进而综合这些概率并对其所在的特征向量做出分类预测。因此,这个模型的基本数学假设是:各个维度上的特征被分类的条件概率之间是相互独立的。

(2)朴素贝叶斯模型

如果采用概率模型来表述,则定义x=<x_{1},x_{2},...,x_{n}>为某一n维特征向量,y\in (c_{1},c_{2},...,c_{k})为该特征向量x所有k种可能的类别,记P(y=c_{i}|x)为特征向量x属于类别c_{i}的概率。根据式(9)的贝叶斯原理:

P(y|x)=\frac{P(x|y)P(y)}{P(x)}......(9)

目标是寻找所有y\in (c_{1},c_{2},...,c_{k})P(y|x)最大的,即\underset{y}{argmax}P(y|x);并且考虑到P(x)对于同一样本都是相同的,因此可以忽略不计。所以,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值