cs231n Assignment1 softmax classifier.

1)IntroductionIt turns out that the SVM is one of two commonly seen classifiers. The other popular choice is the Softmax classifier, which has a different loss function. Softmax 分类器是常用的分类器之一。Example:Li为损失函数, 损失函数评价当前 网络结构的好坏。直观地讲,当评分函数输出结果与真实结果之间差异越大
摘要由CSDN通过智能技术生成

1)Introduction

It turns out that the SVM is one of two commonly seen classifiers. The other popular choice is the Softmax classifier, which has a different loss function. Softmax 分类器是常用的分类器之一。

cross_entropy

y(即label) 表示成如下形式, 为1的 index为其对应的label.
则y可理解为想要达到的效果,而softmax_output 则表示预测的概率。 然后对其做求cross_entropy, 即为其目标函数(损失函数)。 但因yi 中只有正确index才会为1. 所以才会得到example中表示的那样的损失函数。

在这里插入图片描述

详细表示如下:

在这里插入图片描述

在这里插入图片描述

损失函数是cross_entropy 函数,有关cross_entropy可见以下链接
https://zhuanlan.zhihu.com/p/149409908

Example:
在这里插入图片描述
在这里插入图片描述
Li为损失函数, 损失函数评价当前 网络结构的好坏。直观地讲,当评分函数输出结果与真实结果之间差异越大,损失函数输出越大,反之越小。 我们训练网路 就是通过梯度下降法 降低 损失函数输出的值。
由于数据处理后 在 0-1 之间。又因 log 函数(lnx 函数) 如下图所示
在这里插入图片描述

如果 上图中 cat 标签得分为0, 则Loss function 输出结果为无穷大, 若得分为1, 则输出结果为0.
故 cross-entory loss 是一个较好的 损失函数。

2) numeric stability

''利用恒等变形, 解决可能回出现的数据过大问题’'
在这里插入图片描述

3) 公式推导

在这里插入图片描述

Li 对 W 求导时,实际上是对 每一列Wj 求导。 在求导中, 要分清对谁求导。
为了更清楚, Li 先对 W.dot(X) 得到的score(即sj求导)
i 表示 X 的 第i 个输入, yi 表示

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值