机器学习算法之 朴素贝叶斯 分类


 基于概率论的分类算法:朴素贝叶斯

1、核心思想:选择高概率对应的类别

 如下图:

 两类数据分布如下,用p1(x,y)表示数据点(x,y)属于类别1(图中圆点表示的类别)的概率,用p2(x,y)表示数据点(x,y)

 属于类别2(图中三角形点表示的类别)的概率,那么对于一个新数据点(x,y),可以用下面的规则来判断他的类别:

  1)如果p1(x,y) > p2(x,y),那么类别为1

  2)如果p2(x,y) > p1(x,y),那么类别为2

 也就是,我们会选择高概率对应的类别,这就是贝叶斯理论的核心思想

在这里插入图片描述

2、算法原理

 贝叶斯条件概率准则(计算条件概率的方法)
在这里插入图片描述
 已知条件p(X|C),得到p(C|X)的条件概率,条件概率基本概念读者执行补读下

 使用贝叶斯条件概率准则(条件概率)分类
在这里插入图片描述

3、实例

 以留言板分类为例,分类一个留言板是否友好,

 找出单词的概率, 认为这些单词出现的概率是独立的(实际上并不是很准确,有些单词可能有相互依赖,但不影响算法),即独立

 的特征概率,朴素贝叶斯的朴素来源这个,把特征简单认为相互独立的。

 具体算法:
在这里插入图片描述
 W为词向量,Ci为类别I。 p(Ci|w)是词向量W的类别I的概率。本章是类别两种类型,那么p(

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值