极大似然估计 EM算法 Kmeans收敛性

最新推荐文章于 2023-12-01 22:56:31 发布

ID3

最新推荐文章于 2023-12-01 22:56:31 发布

阅读量642

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43269492/article/details/115873845

版权

极大似然估计

估计类条件概率的一种常用策略是先假定其具有某种确定的概率分布形式，再基于训练样本对概率分布的参数进行估计。

贝叶斯决策

首先先看贝叶斯公式
在这里插入图片描述
p(w)为先验概率，表示了每一种标签类别分布的概率
p(x|w)表示条件概率，表示了在某种类别的前提下，出现某类特征的概率
p(w|x)表示后验概率，表示出现了某些特征，并且此时这个样本属于某一类别的概率，可以根据后验概率的大小，进行分类

极大似然估计

极大似然估计就是为了利用已知的样本结果，反推最有可能导致这种结果的参数值。

原理：极大似然估计提供了一种给定观察数据，来评估模型参数的方法，即：模型已定，参数位置，需要估计参数，通过多次试验，观察结果，利用试验实验结果得到某个参数值能使样本出现的概率最大。

记关于类别c的类条件概率为P(x|c)，假设P(x|c)具有确定的形式并且被参数向量θc唯一确定，则我们的任务就是利用训练集D估计参数θc，为了明确起见，将P(x|c)记为P(x|θc)

朴素贝叶斯的前提就是假设样本集中的样本独立分布，可以只考虑一类样本集D，来估计参数θ。
在这里插入图片描述

似然函数（linkehood function）：联合概率密度函数P(D|θ）称为相对于{x1,x2,…,xn} 的θ的似然函数。

在这里插入图片描述
如果是参数空间中能使似然函数最大的θ值，则应该是“最可能”的参数值，那么就是θ的极大似然估计量。它是样本集的函数，记作：

在这里插入图片描述

求解极大似然函数

极大似然估计：求使得出现该组样本的概率最大的θ值

在这里插入图片描述
由于连乘操作容易造成下溢，通常使用对数似然

未知参数只有一个（θ为标量）似然函数满足连续、可微的正则条件下，极大似然估计量是下面微分方程的解：

未知参数有多个（θ为向量）则θ可表示为具有S个分量的未知向量：
在这里插入图片描述
记梯度算子：

若似然函数满足连续可导的条件，则最大似然估计量就是如下方程的解。

方程的解只是一个估计值，只有在样本数趋于无限多的时候，它才会接近于真实值。

样本服从正态分布在这里插入图片描述，则似然函数为：

在这里插入图片描述
它的对数：

求导，得方程组：

联合解得：

EM算法

开始叙述EM之前可以用一个经典的掷硬币的例子来体会EM算法的过程
两枚硬币A和B，假定随机抛掷后正面朝上概率分别为PA，PB。为了估计这两个硬币朝上的概率，咱们轮流抛硬币A和B，每一轮都连续抛5次，总共5轮：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
极大似然估计 EM算法 Kmeans收敛性

极大似然估计估计类条件概率的一种常用策略是先假定其具有某种确定的概率分布形式，再基于训练样本对概率分布的参数进行估计。贝叶斯决策首先先看贝叶斯公式p(w)为先验概率，表示了每一种标签类别分布的概率p(x|w)表示条件概率，表示了在某种类别的前提下，出现某类特征的概率p(w|x)表示后验概率，表示出现了某些特征，并且此时这个样本属于某一类别的概率，可以根据后验概率的大小，进行分类极大似然估计极大似然估计就是为了利用已知的样本结果，反推最有可能导致这种结果的参数值。原理：极大似然估计提供了一
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。