【Loss】深入理解损失函数logloss

最新推荐文章于 2023-03-15 15:30:13 发布

凝眸伏笔

最新推荐文章于 2023-03-15 15:30:13 发布

阅读量7.6k

点赞数 1

分类专栏：面试故事会 DNN 文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pearl8899/article/details/106266866

版权

DNN 同时被 2 个专栏收录

21 篇文章 6 订阅

订阅专栏

面试故事会

5 篇文章 0 订阅

订阅专栏

思考：当我们习惯性的使用封装好的深度学习框架时，是否想过探寻他们调用函数背后的意义，也就是他的实现逻辑？如果封装不公开源码，那你是否留意过调用函数时，输入的参数？今天来看看，一个比较容易忽略的点：损失函数。不知道为何，想到损失函数的时候，脑子里出现了Sigmod函数的输出，某个灵感一闪而过，缺没有抓住。回去巴拉巴拉网络结构，发现：论文中没注意损失函数形式，网络搭建时，也没有特别留意损失函数的设置，粗心真的可怕..

loss(name='logloss', loss_type='logistic', inputs=[fc_out.name])

主要内容：

1.先来看几个深度网络的损失函数

2.为什么是这个损失函数，这个损失函数的优势

3.对于0-1标签的模型，这个损失函数怎么理解，网络的预测值代表什么意义？跟标签怎么对应？

几个常见深度网络的损失函数

PNN的损失函数：log loss，广泛用于捕捉两个概率分布的差异(翻译的优点别扭)。

DCN的损失函数：

DIN的损失函数：

为什么是这个损失函数，这个损失函数的优势

这几个网络的损失函数都为logloss，y^是预测结果，可以看出是sigmod函数的输出，映射到(0, 1)之间，表示为ctr，预测为正例的概率，联想到逻辑回归，事件发生的概率为p，对数几率函数：log(p/(1-p))，化简得到wx+b，关于输入的线性回归，也就是说，wx+b的值越大，概率值越接近于1，越小概率值越接近于0。那我们优化的目标就是：正例概率最大化。如果一个样本看做一个事件的话，时间发生的概率 $P(\widehat{y}|x) = p^{y}*(1-p)^{1-y}$ ，让这个概率最大，这是似然函数，用极大释然估计方法估计模型参数。

其实这个问题中也包含的解答了第三个问题。

参考：

李航老师的统计机器学习p78-79.

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【Loss】深入理解损失函数logloss

思考：当我们习惯性的使用封装好的深度学习框架时，是否想过探寻他们调用函数背后的意义，也就是他的实现逻辑？如果封装不公开源码，那你是否留意过调用函数时，输入的参数？今天来看看，一个比较容易忽略的点：损失函数。不知道为何，想到损失函数的时候，脑子里出现了Sigmod函数的输出，某个灵感一闪而过，缺没有抓住。回去巴拉巴拉网络结构，发现：论文中没注意损失函数形式，网络搭建时，也没有特别留意损失函数的设置，粗心真的可怕..loss(name='logloss', loss_type='logistic', in
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。