算法工程师面试之softmax函数

总结


1 ~

2 问题

2.1 softmax 之后还可以继续梯度更新吗? 理由是什么?

可以的。
理由如下:
可以先写出softmax 的公式:
e p i ∑ j e p j \frac{e^{p_i}}{\sum_j e^{p_j}} jepjepi

2.2 为啥softmax + 交叉熵不会存在类别不平衡问题?

在这里插入图片描述

1.实验一

在这里插入图片描述

得到的执行结果是:
在这里插入图片描述

3. 分析

在计算到 这个score 的时候,就会发现很多值都是相同的,如果后面的value 值倘若再相似,那么就会导致出现大问题(所有计算的结果都是相同的,最后即使不同的句子得到的分类结果也是相同的),比如下面的这个logits.
在这里插入图片描述

4. softmax, argmax 等区别与联系

~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

说文科技

看书人不妨赏个酒钱?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值