损失函数+++

最新推荐文章于 2024-07-24 21:37:35 发布

小猪猪爱吃饭

最新推荐文章于 2024-07-24 21:37:35 发布

阅读量182

点赞数

文章标签：概率论算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45639117/article/details/120212084

版权

文章目录

1、 LR的损失函数

最大似然损失函数（MLE）
$Loss=-y_{i} *log(p(x_{i}))-(1-y_{i})*log(1-p(x_{i}))$

2、相对熵（KL散度）

$D_{KL}(p\left | \right | q)=\sum_{x}(p(x))*log\frac{p(x)}{q(x)}$

3、交叉熵

$\sum_{x}p(x)*log\left ( q(x) \right )$

3.1交叉熵函数与最大似然函数的联系和区别？

区别：交叉熵函数使用来描述模型预测值和真实值的差距大小，越大代表越不相近；似然函数的本质就是衡量在某个参数下，整体的估计和真实的情况一样的概率，越大代表越相近。

联系：交叉熵函数可以由最大似然函数在伯努利分布的条件下推导出来，或者说最小化交叉熵函数的本质就是对数似然函数的最大化。

4、log loss

用于二分类任务
$\frac{1}{N}*\sum_{N}^{i=1} ((y_{i}*log(p_{i})+(1-y_{i})*log(1-p_{i}))$
缺点：每一次梯度回传对每一个类别具有相同的关注度，容易受类别不平衡的影响。

5、均方误差（Mean Squared Error）

均方误差是指参数估计值与参数真值之差平方的期望值; MSE可以评价数据的变化程度，MSE的值越小，说明预测模型描述实验数据具有更好的精确度。
通常用来做回归问题的代价函数。
$\frac{1}{N} \sum_{i=1}^N (y^{(i)} - f(x^{(i)}))^2$

6、均方根误差

均方根误差是均方误差的算术平方根，能够直观观测预测值与实际值的离散程度。
通常用来作为回归算法的性能指标。
$\sqrt{\frac{1}{N} \sum_{i=1}^N (y^{(i)} - f(x^{(i)}))^2 }$

7、平均绝对误差

平均绝对误差是绝对误差的平均值，平均绝对误差能更好地反映预测值误差的实际情况。
通常用来作为回归算法的性能指标。
$\frac{1}{N} \sum_{i=1}^N |y^{(i)} - f(x^{(i)})|$

8、focal loss

在这里插入图片描述
alpha用于平衡正负样本不均的问题。
gamma调节简单样本权重降低的速率，当gamma为0时即为交叉熵损失函数，当gamma增加时，调整因子的影响也在增加。实验发现gamma为2是最优。

小猪猪爱吃饭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
损失函数+++

文章目录1、 LR的损失函数2、相对熵（KL散度）3、交叉熵3.1交叉熵函数与最大似然函数的联系和区别？4、log loss5、均方误差（Mean Squared Error）6、均方根误差7、平均绝对误差8、focal loss1、 LR的损失函数最大似然损失函数（MLE）Loss=−yi∗log(p(xi))−(1−yi)∗log(1−p(xi))Loss=-y_{i} *log(p(x_{i}))-(1-y_{i})*log(1-p(x_{i}))Loss=−yi∗log(p(xi))−(1
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。