直观理解神经网络最后一层全连接+Softmax

最新推荐文章于 2024-07-07 08:10:57 发布

F~C~H

最新推荐文章于 2024-07-07 08:10:57 发布

阅读量3.7k

点赞数

分类专栏：深度学习

深度学习专栏收录该内容

12 篇文章 2 订阅

订阅专栏

文章目录

写在前面
全连接层与Softmax回顾
加权角度
模板匹配
几何角度
Softmax的作用
总结
参考

写在前面

这篇文章将从3个角度：加权、模版匹配与几何来理解最后一层全连接+Softmax。掌握了这3种视角，可以更好地理解深度学习中的正则项、参数可视化以及一些损失函数背后的设计思想。

全连接层与Softmax回顾

深度神经网络的最后一层往往是全连接层+Softmax（分类网络），如下图所示，图片来自StackExchange。

先看一下计算方式：全连接层将权重矩阵与输入向量相乘再加上偏置，将 $n n n$ $y_{j}^= s o f t m a x (z_{j}) = \frac{e ^{z_{j}}}{\sum _{K} e ^{z_{j}}}$

总结

本文介绍了3种角度来更直观地理解全连接层+Softmax，

加权角度，将权重视为每维特征的重要程度，可以帮助理解L1、L2等正则项
模板匹配角度，可以帮助理解参数的可视化
几何角度，将特征视为多维空间中的点，可以帮助理解一些损失函数背后的设计思想（希望不同类的点具有何种性质）

视角不同，看到的画面就不同，就会萌生不同的idea。有些时候，换换视角问题就迎刃而解了。

以上。

参考

CS231n: Convolutional Neural Networks for Visual Recognition

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。