机器学习(周志华)学习笔记六:贝叶斯分类器(上)

一、贝叶斯分类器

贝叶斯分类器包括朴素贝叶斯分类器、半朴素贝叶斯分类器、贝叶斯网,本文主要介绍前两者。
三种分类器依照对属性间依赖关系的重视程度进行区分.朴素贝叶斯分类器假设属性间相互独立,互不影响。半朴素贝叶斯分类器假设属性间“独依赖”,即假设每个属性在类别之外最多仅依赖于其他一个属性。而贝叶斯网则更加突出了结点间的相互关系,贝叶斯网中变量可存在“同父结构”、“V型结构”、“顺序结构”三种典型的依赖关系。

二、贝叶斯分类器的基本思想

利用贝叶斯分类器进行决策,实质上就是判断使后验概率P(c|x)最大的类别c,即在已知数据x的情况下,最有可能发生的类别c,就是决策划分的类别。公式如下:
贝叶斯分类器基本思想
按照上述想法,可以依照贝叶斯公式将后验概率转化为显眼概率,公式如下:
贝叶斯公式

三、朴素贝叶斯分类

设向量x由d个属性组成,xi为向量x在第i个属性上的取值。朴素贝叶斯分类假设每个属性的取值相互独立。公式如下:
朴素贝叶斯分类基本假设

四、半朴素贝叶斯分类

假设向量x中属性xi“独依赖”,公式如下:
半朴素贝叶斯分类基本思想
值得说明的是,式中m’可以限制“独依赖”属性依赖性的强弱,对于依赖性较弱的“独依赖”属性进行舍弃,从而简化运算。

五、关于概率求解问题的说明

对于离散属性,概率求解十分简单,只需要进行计数,然后除以总数即可近似获得概率值。
对于连续属性,概率求解需要引入概率密度函数进行计算,通常使用高斯函数进行模拟。对于连续属性来说,在任意一个点取值的概率均为0,因此用该点的概率密度值代表该点发生概率的大小。
然而,在进行贝叶斯分类求解时,往往也会陷入高阶联合概率求解的问题。例如,对于概率P(xj | c, xi)进行求解,就需要依据xi,xj的连续性质,讨论四种可能情况。其中,当xi,xj均为连续变量时,会涉及到2个变量的联合概率密度,增加了计算量,而且当条件变量增多时,这个问题会更加突出。(注:关于四种情况的详细讨论,第七部分在代码中体现)

六、朴素贝叶斯分类部分代码

    def calculate_likelihood(self, is_continuous, i, xi):
        """
        计算i属性值xi的 P(xi|c)
        """
        good_list = data.attrs_list[i][0:data.good_count]
        bad_list = data.attrs_list[i][data.good_count:data.sample_count]
        if is_continuous:
            # 连续情况
            m_good, v_good = self.calculate_parameters(good_list)
            m_bad, v_bad = self.calculate_parameters(bad_list)
            p_good = self.calculate_gauss(xi, m_good, v_good)
            p_bad = self.calculate_gauss(xi, m_bad, v_bad)
        else:
            # 离散情况, 拉普拉斯修正
            p_good = (self.calculate_count(xi, good_list) + 1) / (data.good_count + data.Ni_list[i])
            p_bad = (self.calculate_count(xi, bad_list) + 1) / (data.bad_count + data.Ni_list[i])

        return p_good, p_bad

    def judge(self):
        """
        计算概率,并进行判决
        :return:分析结果、好瓜概率、坏瓜概率
        """
        p_good, p_bad = self.calculate_pc
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

萌哒哒虎

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值