CS231n作业笔记1.5:Softmax的误差以及梯度计算

这篇博客详细介绍了CS231n课程中关于Softmax分类器的误差函数和梯度计算,包括损失函数的实现细节,如广播机制、真值标签的处理以及平均处理防止溢出。同时,文章讨论了梯度计算的重点,如真值标签处的梯度传播和全类别传播的技巧。
摘要由CSDN通过智能技术生成

CS231n简介

详见 CS231n课程笔记1:Introduction
本文都是作者自己的思考,正确性未经过验证,欢迎指教。

作业笔记

Softmax的误差函数以及正则项请参考 CS231n课程笔记3.1:线性分类器(SVM,softmax)的误差函数、正则化
代码部分请参考 python、numpy、scipy、matplotlib的一些小技巧
注:这里只写了向量化的实现方法,因为非向量方法代码冗长,而且速度慢。

1. 损失函数Loss Function

这里值得注明的有
1. 使用了broadcasting来把sum_exp拓展到所有class label处;
2. 使用了integer array index用于得到真值处的log_loss;
3. 使用了average函数防止sum函数超范围;
4. 做除法的时候加上1e-15用于防止除0。

  scores = X.dot(W)
  exp_s
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值