机器学习——朴素贝叶斯

本文深入探讨朴素贝叶斯算法的理论基础,解释贝叶斯定理和全概率公式在分类问题中的应用。文章通过介绍三种常见模型——多项式模型、高斯模型和伯努利模型,详细阐述如何处理离散和连续特征,并讨论平滑处理的重要性。
摘要由CSDN通过智能技术生成

朴素贝叶斯(Naive Bayes)是一种简单的分类算法。

一、朴素贝叶斯的理论基础

给定训练数据集(X,Y),其中每个样本x都包括n维特征,即x=(x1,x2,x3,…,xn),类标记集合含有k种类别,即y=(y1,y2,…,yk)。

如果现在来了一个新样本x,我们要怎么判断它的类别?从概率的角度来看,这个问题就是给定x,它属于哪个类别的概率最大。那么问题就转化为求解P(y1|x),P(y2|x),…,P(yk|x)中最大的那个,即求后验概率最大的。

P(yk|x)根据贝叶斯定理和全概率公式可以求出。分子中的P(yk)是先验概率,根据训练集就可以简单地计算出来。
贝叶斯公式:
在这里插入图片描述
全概率公式:
在这里插入图片描述
朴素贝叶斯算法对条件概率分布作出了独立性的假设,假设各个维度的特征x1,x2,…,xn互相独立。

那么条件概率公式可以化为:
在这里插入图片描述
于是朴素贝叶斯分类器可表示为:
在这里插入图片描述
因为对所有的yk,上式中的分母的值都是一样的,所以可以忽略分母部分。朴素贝叶斯分类器最终表示为:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值