机器学习之朴素贝叶斯算法

本文深入探讨了朴素贝叶斯分类算法,从分类问题的数学描述和概率角度出发,详细阐述了贝叶斯定理及其在分类中的应用。通过实例解析算法原理,并介绍了其在Python中的实现及参数估计方法。朴素贝叶斯算法以其简单高效的特点,适用于小规模数据和多分类任务,但依赖于特征间的独立假设,可能导致模型效果受限。
摘要由CSDN通过智能技术生成

引言:  很多机器学习算法都从误差角度来构建模型函数f,也就是减少损失函数。而贝叶斯算法则是从概率的角度来考虑。贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。

 

1  分类问题综述

 对于分类问题,其实谁都不会陌生,日常生活中我们每天都进行着分类过程。例如,当你看到一个人,你的脑子下意识判断他是学生还是社会上的人;你可能经常会走在路上对身旁的朋友说“这个人一看就很有钱”之类的话,其实这就是一种分类操作。

 

既然是贝叶斯分类算法,那么分类的数学描述又是什么呢?

 

数学角度分析:

已知m个样本x是特征变量,y是对应的类别。

要求一个模型函数h,对于新的样本x,能够尽量准确的预测出 y=h(x)

 

概率角度分析:

试想一个样本x,在可以的情况下,你可以求出它属于各分类的概率,即P(y1​∣x),P(y2​∣x),......P(yn​∣x),其中有最大值的

P(ym|x),x即属于该分类ym。

 

其中Y叫做类别集合,其中每一个元素是一个类别,而X叫做项集合(特征集合),其中每一个元素是一个待分类项,f叫做分类器。分类算法的任务就是构造分类器f。

 

分类算法的内容是要求给定特征,让我们得出类别,这也是所有分类问题的关键。那么如何由指定特征,得到我们最终的类别,也是我们下面要讲的。

 

2  朴素贝叶斯分类

那么既然是朴素贝叶斯分类算法,它的核心算法又是什么呢?

是下面这个贝叶斯公式:

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值