【机器学习-周志华】学习笔记-第七章

vircorns

已于 2022-09-06 22:50:42 修改

阅读量828

点赞数

分类专栏： # 机器学习文章标签：机器学习算法人工智能

于 2022-08-28 21:47:39 首次发布

本文链接：https://blog.csdn.net/weixin_43476037/article/details/126552117

版权

机器学习专栏收录该内容

14 篇文章

订阅专栏

记录第一遍没看懂的
记录觉得有用的
其他章节：
        第一章
         第三章
         第五章
         第六章
         第七章
         第八章
         第九章
         第十章
         十一章
         十二章
         十三章
         十四章
         十五章
         十六章

第七章的前提：所有相关概率都已知
在这里插入图片描述
7.1节首先定义了条件风险(公式7.1)，然后把每一个样本的条件风险的数学期望表达了出来(公式7.2)，然后返回来定义使得每个样本达到最小的分类器记录下来(公式7.3)。

极大似然估计

在这里插入图片描述

        极大似然估计是要先假设参数服从一个先验分布。可以看公式(7.12)(7.13)对应的例子，他假设了概率密度函数复制高斯分布，而高斯分布形式为： $p(x)=(2\pi\sigma^2)^{-\dfrac{1}{2}}exp(-\dfrac{(x-\mu)^2}{2\sigma^2})$ 。因此，相当与把高斯分布的表达式代入(7.10)之中，去解(7.11)中的问题。首先代入可得：
$LL(\theta_c)=\sum_{x\in D_c}log(p\theta_c(x))=\sum_{x\in D_c} log((2\pi\sigma^2_c)^{-\dfrac{1}{2}}exp(-\dfrac{(x-\mu_c)^2}{2\sigma^2_c }))=\sum_{x\in D_c}-\dfrac{1}{2}log2\pi\sigma^2_c-\dfrac{(x-\mu_c)^2}{2\sigma^2_c }$
        然后是求偏导等于0：
$\partial LL/\partial \mu_c = \sum_{x\in D_c}-(x-\mu_c)/\sigma^2_c = 0 \rArr \sum_{x\in D_c}x= \sum_{x\in D_c} \mu_c\\ \partial LL/\partial \sigma^2_c = \sum_{x\in D_c}-\dfrac{1}{2\sigma^2_c }+\dfrac{(x-\mu_c)^2}{2(\sigma^2_c)^2 }=0 \rArr \sum_{x\in D_c}\sigma^2_c= \sum_{x\in D_c} (x-\mu_c)^2\\$
        即，参数最大似然估计为：
在这里插入图片描述