cs231n作业——softmax

最新推荐文章于 2024-07-26 06:30:00 发布

那是真的牛皮

最新推荐文章于 2024-07-26 06:30:00 发布

阅读量926

点赞数

分类专栏： cs231n 文章标签：深度学习机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42186444/article/details/120198429

版权

cs231n作业——softmax

cs231n

cs231n作业——softmax

1.基础知识

Inputs:

- W: A numpy array of shape (D, C) containing weights.

- X: A numpy array of shape (N, D) containing a minibatch of data.

- y: A numpy array of shape (N,) containing training labels; y[i] = c means

that X[i] has label c, where 0 <= c < C.

- reg: (float) regularization strength

Returns a tuple of:

- loss as single float

- gradient with respect to weights W; an array of same shape as W

“”"

输入的w是d个属性和c个类别，x是n给样本和d个属性，输出loss和梯度

softmax公式如上所示，可以把所有的输出y值，进行变成概率，且都是正概率，相加的概率和为1

2.使用循环进行求loss和求导

求loss，我们一般使用交叉熵进行验证损失，交叉熵

计算两个概率之间的距离。因为yi为标签值，只有为真实标签时yi才wei1，其他为0.，所以这个就可以简化为-lnai。

求导是链式求导法则，-lnai求导就是 -1/ai。

z4 = w41o1+w42o2+w43*o3

下面应该是ez4

接下来就是对z4进行求导

z4在上下都有，那么我们使用导数进行求导，上下求导。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZBmT36SP-1631159742076)(https://z3.ax1x.com/2021/09/09/hqKRZ6.png)]

可以发现就是aj（1-aj）

如果是对z5进行求导，那么就是-aj*ai。剩下

最低0.47元/天解锁文章

那是真的牛皮

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
cs231n作业——softmax

cs231n作业——softmaxcs231ncs231n作业——softmax1.基础知识2.使用循环进行求loss和求导3.向量化进行求导和loss1.基础知识Inputs:- W: A numpy array of shape (D, C) containing weights.- X: A numpy array of shape (N, D) containing a minibatch of data.- y: A numpy array of shape (N,) contain
复制链接

扫一扫

专栏目录

那是真的牛皮 CSDN认证博客专家 CSDN认证企业博客

码龄6年

62: 原创

43万+: 周排名

222万+: 总排名

5万+: 访问

: 等级

788: 积分

5: 粉丝

16: 获赞

6: 评论

68: 收藏

私信

关注

热门文章

分类专栏

最新评论

MMPretrain
油碟小菜: 我用的自己的数据集，num_classes不一样，但我不知道、mmpretrain是要在哪里修改？
MMPretrain
油碟小菜: 虽然可以导入预训练，但会有一条提示，这个怎么解决？ The model and loaded state dict do not match exactly size mismatch for head.fc.weight: copying a param with shape torch.Size([1000, 384]) from checkpoint, the shape in current model is torch.Size([12, 384]). size mismatch for head.fc.bias: copying a param with shape torch.Size([1000]) from checkpoint, the shape in current model is torch.Size([12]).
cs231n作业一 knn
sa_18wood: 清晰易懂详细，谢谢！！！
cs231n作业——softmax
九土master: [code=python] correct_p = p[np.arange(num_train), y.reshape(-1)] [/code] [code=python] p[np.arange(num_train), y.reshape(-1)] -= 1 [/code] y要reshape成一维数组，要不然原本的y是列向量，达不到选择的作用。
Could not set property ‘id‘ of ‘class com..serviceedu.entity.
M1namoto_Sakura: 谢谢，找了好久才找到

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。