机器学习（周志华）学习笔记六：贝叶斯分类器（上）

最新推荐文章于 2022-03-30 21:14:09 发布

萌哒哒虎

最新推荐文章于 2022-03-30 21:14:09 发布

阅读量576

点赞数 1

分类专栏： python 文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/mddh_123/article/details/104473898

版权

一、贝叶斯分类器

贝叶斯分类器包括朴素贝叶斯分类器、半朴素贝叶斯分类器、贝叶斯网，本文主要介绍前两者。
三种分类器依照对属性间依赖关系的重视程度进行区分.朴素贝叶斯分类器假设属性间相互独立，互不影响。半朴素贝叶斯分类器假设属性间“独依赖”，即假设每个属性在类别之外最多仅依赖于其他一个属性。而贝叶斯网则更加突出了结点间的相互关系，贝叶斯网中变量可存在“同父结构”、“V型结构”、“顺序结构”三种典型的依赖关系。

二、贝叶斯分类器的基本思想

利用贝叶斯分类器进行决策，实质上就是判断使后验概率P(c|x)最大的类别c，即在已知数据x的情况下，最有可能发生的类别c，就是决策划分的类别。公式如下：
贝叶斯分类器基本思想
按照上述想法，可以依照贝叶斯公式将后验概率转化为显眼概率，公式如下：

三、朴素贝叶斯分类

设向量x由d个属性组成，xi为向量x在第i个属性上的取值。朴素贝叶斯分类假设每个属性的取值相互独立。公式如下：
朴素贝叶斯分类基本假设

四、半朴素贝叶斯分类

假设向量x中属性xi“独依赖”，公式如下：
半朴素贝叶斯分类基本思想
值得说明的是，式中m’可以限制“独依赖”属性依赖性的强弱，对于依赖性较弱的“独依赖”属性进行舍弃，从而简化运算。

五、关于概率求解问题的说明

对于离散属性，概率求解十分简单，只需要进行计数，然后除以总数即可近似获得概率值。
对于连续属性，概率求解需要引入概率密度函数进行计算，通常使用高斯函数进行模拟。对于连续属性来说，在任意一个点取值的概率均为0，因此用该点的概率密度值代表该点发生概率的大小。
然而，在进行贝叶斯分类求解时，往往也会陷入高阶联合概率求解的问题。例如，对于概率P(xj | c, xi)进行求解，就需要依据xi，xj的连续性质，讨论四种可能情况。其中，当xi，xj均为连续变量时，会涉及到2个变量的联合概率密度，增加了计算量，而且当条件变量增多时，这个问题会更加突出。（注：关于四种情况的详细讨论，第七部分在代码中体现）

六、朴素贝叶斯分类部分代码

    def calculate_likelihood(self, is_continuous, i, xi):
        """
        计算i属性值xi的 P(xi|c)
        """
        good_list = data.attrs_list[i][0:data.good_count]
        bad_list = data.attrs_list[i][data.good_count:data.sample_count]
        if is_continuous:
            # 连续情况
            m_good, v_good = self.calculate_parameters(good_list)
            m_bad, v_bad = self.calculate_parameters(bad_list)
            p_good = self.calculate_gauss(xi, m_good, v_good)
            p_bad = self.calculate_gauss(xi, m_bad, v_bad)
        else:
            # 离散情况, 拉普拉斯修正
            p_good = (self.calculate_count(xi, good_list) + 1) / (data.good_count + data.Ni_list[i])
            p_bad = (self.calculate_count(xi, bad_list) + 1) / (data.bad_count + data.Ni_list[i])

        return p_good, p_bad

    def judge(self):
        """
        计算概率，并进行判决
        :return:分析结果、好瓜概率、坏瓜概率
        """
        p_good, p_bad = self.calculate_pc

最低0.47元/天解锁文章

萌哒哒虎

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习（周志华）学习笔记六：贝叶斯分类器（上）

本文记录对《机器学习》贝叶斯分类器部分的理解，并实现习题7.3，7.4
复制链接

扫一扫

专栏目录