参数估计

最新推荐文章于 2023-11-19 20:59:15 发布

mao_feng

最新推荐文章于 2023-11-19 20:59:15 发布

阅读量761

点赞数

分类专栏：深度学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mao_feng/article/details/68941999

版权

深度学习专栏收录该内容

34 篇文章 1 订阅

订阅专栏

回归问题：
- 线性回归问题： y = wx+b
- 对数几率回归问题: y = 1 / (1+exp(-(wx+b)))
参数估计方法：
- 最小二乘参数估计的损失函数是用于度量预测属于该类或实际值的偏差；

L = ∑(z - (wx+b))^2

- 最大似然参数估计的损失函数是用于度量属于该类概率的分布的偏差。

L = ∑(z*log(y) + (1-z)*log(1-y)), 其中 y = 1 / (1+exp(-(wx+b))) 。

最大似然是达到拟合样本概率分布的最好的参数选取，即统计模型最合理。

为啥用以上这种形式的公式？一种解释是，信息熵，信源的平均不确定性应当为单个符号不确定性-logPi的统计平均值（E），可称为信息熵。因此这个似然函数表达了把样本识别为0或1的熵，我们要最小化这个熵。事实上，交叉熵 $H(X,q) = -\sum_xp(x)\log q(x)$ 的本质就是最大似然。可以说交叉熵是直接衡量两个分布，或者说两个model之间的差异。而似然函数则是解释以model的输出为参数的某分布模型对样本集的解释程度。

另一种解释是，对y取对数，那么log(y/(1-y)) = wx + b, 就变成了一个对几率(正反比例)线性回归问题。事实上，y = g(wx+b) 是个广义线性模型，这里的g是“联系函数（起到将线性回归模型的预测值与真实标记联系起来的作用）”，是需要单调可微的。

或者说：涉及到似然函数的许多应用中，更方便的是使用似然函数的自然对数形式，即“对数似然函数”。求解一个函数的极大化往往需要求解该函数的关于未知参数的偏导数。由于对数函数是单调递增的，而且对数似然函数在极大化求解时较为方便，所以对数似然函数常用在最大似然估计及相关领域中。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

mao_feng CSDN认证博客专家 CSDN认证企业博客

码龄8年

40: 原创

52万+: 周排名

97万+: 总排名

68万+: 访问

: 等级

2484: 积分

198: 粉丝

245: 获赞

125: 评论

908: 收藏

私信

关注

热门文章

分类专栏

最新评论

用图卷积来建模视频
88882223: 有开源代码了嘛？
用tensorflow画ROC曲线
龙卷风hu~: fpr 怎么会等于 fp / float(fp + tp) 呢
当小样本遇上机器学习 fewshot learning
weixin_45713952: 我有代码，需要吗
深度学习如何设置学习率
Wendy_lz: 你好，你是直接保存当前特征图，然后 resize 成肉眼可分辨的图像还是通过卷积的反操作得到最后可视化的图像啊。 resize 的话应该掺杂了很多其他信息吧，并不完全代表当时网络的特征图信息
当小样本遇上机器学习 fewshot learning
mao_feng: https://github.com/phecy/SSL-FEW-SHOT

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。