《统计学习方法》—— 4.朴素贝叶斯（Python实现）

最新推荐文章于 2021-09-13 14:23:53 发布

Chris_zhangrx

最新推荐文章于 2021-09-13 14:23:53 发布

阅读量445

点赞数 1

分类专栏：读书笔记

本文链接：https://blog.csdn.net/Chris_zhangrx/article/details/85245931

版权

读书笔记专栏收录该内容

52 篇文章 3 订阅

订阅专栏

本文主要是在阅读过程中对本书的一些概念摘录，包括一些个人的理解，主要是思想理解不涉及到复杂的公式推导。若有不准确的地方，欢迎留言指正交流

本文完整代码见 github ：https://github.com/anlongstory/awsome-ML-DL-leaning/lihang-reading_notes （欢迎 Star ? ）

朴素贝叶斯法（naive_bayes.py）

首先朴素贝叶斯法属于生成模型，其是基于特征条件独立假设学习输入/输出的联合概率分布，然后基于此模型，对给定输入 x 用贝叶斯定理求出后验概率最大的输出 y。

这里的“朴素”，是因为此方法对条件概率分布作了条件独立性的假设，这是一种很强的假设，所以是朴素（naive）。

使用训练数据学习的是 P（X|Y） 和 P（Y）的估计，最后得到联合分布概率：P（X,Y）=P(X|Y)*P(Y)。

这里假设P（X|Y）满足条件独立性：

于是可以得到：

最终学习目的是后验概率最大化：

后验概率最大化

0-1损失函数时对期望风险最小化等同于后验概率最大化：

参数估计

极大似然估计
贝叶斯估计
用极大似然估计可能会出现所要估计的概率值为 0 的情况，这会影响到后验概率的计算结果，使分类产生偏差，解决方法就是采用贝叶斯估计。

代码实现

这部分主要实现模型高斯朴素贝叶斯：

特征的可能性假设为高斯分布，其概率密度函数为：

# 数学期望
@staticmethod
def mean(x):
    return sum(x)/float(len(x))

# 标准差
def std(self,x):
    avg = self.mean(x)
    return math.sqrt(sum(math.pow(x_i-avg,2) for x_i in x)/float(len(x)))

# 概率密度函数
def gaussian_prob(self,x,mean,std):
    exp = math.pow(math.e, -1*(math.pow(x - mean,2))/(2*std))
    return (1/(math.sqrt(2*math.pi*std)))*exp

最后基于上面构建的模型进行贝斯斯方法的实现，并对数据做出预测。详情见完整代码 naive_bayes.py

Chris_zhangrx

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《统计学习方法》—— 4.朴素贝叶斯（Python实现）

本文主要是在阅读过程中对本书的一些概念摘录，包括一些个人的理解，主要是思想理解不涉及到复杂的公式推导。若有不准确的地方，欢迎留言指正交流本文完整代码见 github ：https://github.com/anlongstory/awsome-ML-DL-leaning/lihang-reading_notes （欢迎 Star
复制链接

扫一扫