cs231n课程记录

课程作业参考:
https://github.com/JPLAY0/CS231nAssignment

1.关于多维输入输出与kernel size 和deepth的关系。下面这篇文章解释的比较详细,可以参考。
https://blog.csdn.net/u011734144/article/details/84066867
比如输入是rgb三通道图片,则kernel的deepth一般就是3,也就是size就是width x heigth x deepth.最后计算的结果就是三个channel的数值相加再加上bias值就得到这一点的值。kernel的个数对应输出的channel。

  1. 关于卷积核权值的更新,可以参考如下几篇文章:
    https://zhuanlan.zhihu.com/p/64248652
    https://www.cnblogs.com/bnuvincent/p/8921956.html
    其实总结下来,就是因为卷积核的参数是很多连接共用的,所以针对每个卷积核的参数,其梯度是一个矩阵,那我们更新这个参数的时候,需要将这个梯度矩阵所有元素求和,然后利用这个和来更新权值。
    第二篇文章还介绍了对于pooling层导致的反向传播求梯度的时候矩阵维度不匹配的问题,需要上采样回去来匹配维度,上采样的方式就直接copy即可,也就是如果是2倍的上采样,则将每一个元素的值copy 3次,形成一个2x2的矩阵,其他元素都一样操作
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值