贝叶斯算法简单理解

以下是我对贝叶斯算法的简单理解,

因时间关系,推导不是很严谨,仅仅记录一下基本训练和推理实现:


算法简单公式

贝叶斯定理:P(C|X) = P(X|C)*P(C) | P(X)  (注:这里C和X都是集合)

C是所有类别集合  ---  比如一个哥们 帅与不帅的类别,C1和C2

X是所有样本特征集合  ---  比如一个哥们的 身高和颜值,X1/X2

我们称P(C|X)样本特征下的一些类别出现的概率,也是我们推理时候要求得的后验概率。


训练:

比如有如下训练集,其中“帅不帅”是二分类标签!!!    身高和颜值是一个人的特征。

身高颜值帅不帅 (标签)
优秀
优秀
一般
一般
不行
不行

(1)公式中右边 P(X|C) 表示 某个类中出现某个特征的概率(似然), 训练集全部P(Xi | Ci) 有:

p(身高=优秀|帅=是):2/6,p(身高=一般|帅=是):1/6,p(身高=不行|帅=是):0,

p(身高=优秀|帅=否):0,p(身高=一般|帅=否):1/6,p(身高=不行|帅=否):2/6,

p(颜值=高|帅=是):2/6,p(颜值=中|帅=是):1/6,p(颜值=低|帅=是):0

p(颜值=高|帅=否):0,p(颜值=中|帅=否):1/6,p(颜值=低|帅=否):1/6

(2) 公式中右边 P(C) 表示 所有类标签出现的概率先验,由表格中国可以看到:

p(帅=是)  和 p(帅=否)都等于 3/6 = 0.5

(3)公式中右边 P(X) 一般都是特征出现的概率(证据因子)简单计算时候,因为推理时候某一个样本的特征是不变,可忽略计算。所以一般简单实用时候用P(C|X) = P(X|C)*P(C)


推理:

假如现在新来了一个样本,身高是:不行,颜值是:中,那么怎么判断这哥们 类别 帅不帅 呢?

那么开始带入公式,计算每个这些特征下,帅与不帅的概率即可!(这里涉及用到朴素贝叶斯,就是假定各个特征下,条件概率相互独立,独立性简单记为:P(AB)=P(A)P(B))

最终,

P(帅=是 | 身高=不行,颜值=中)= p(身高不行|帅) * p(颜值中|帅) * p(帅) = 0 * 1/6 * 0.5 = 0

P(帅=否 | 身高=不行,颜值=中)= p(身高不行|不帅) * p(颜值中|不帅) * p(不帅)

                                                          = 2/6 * 1/6 * 0.5 = 1/36

综合下来,本次计算,不帅的概率很大,所以这个人的推理结果是:不帅!!!

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值