如何理解对数似然损失函数

最新推荐文章于 2024-07-28 10:16:39 发布

MD_

最新推荐文章于 2024-07-28 10:16:39 发布

阅读量9.6k

点赞数 5

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27690765/article/details/107530899

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

介绍

通过最大似然估计值来衡量损失。
最大似然估计的原理是：找到一组估计值，使得未知参数取该组估计值时，观察值以最大概率出现。

设总体 $X$ 为离散型随机变量，其分布律为 $P(X=x_k)=p(x_k,\theta), k=1,2\dots$ ，其中 $\theta$ 是待估参数，则 $X_1=x-1，X_2=x_2,\dots,X_N=x_n$ 的概率为：
$P(X_1=x-1，X_2=x_2,\dots,X_N=x_n)=\prod\limits_{k=1}\limits^{n}P(X_k=x_k)=\prod\limits_{k=1}\limits^{n}p(x_k,\theta)$ .
上式是 $\theta$ 的函数，称为 似然函数，记为 $L(\theta)$ ，即
$L(\theta)=L(\theta;x_1,x_2,\cdots,x_n)=\prod\limits_{k=1}\limits^{n}p(x_k,\theta)$

上式完全是乘积的形式，大多数情况下会取个对数，方便求解或者不会溢出。

从另外一个角度来理解似然函数：当似然函数取最大值时，意味着这组参数一定程度上非常贴合所给数据分布，也就是说，在这组参数下，模型预测的值和真实值相对来说比较接近，也就是损失函数较小。

为了能够直接利用上述似然函数来表达损失函数的定义【损失值越小越好】，对取了对数的似然函数再取个负号。

参考资料

[1] 对数损失函数是如何度量损失的？-知乎
[2]《概率统计与数据处理》-曹菊生；魏国强

关注

5
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。