CS231n笔记2--Fully Connected Neural Network与Activation Function

最新推荐文章于 2024-06-30 17:00:31 发布

置顶

LiemZuvon

最新推荐文章于 2024-06-30 17:00:31 发布

阅读量7.5k

点赞数 2

分类专栏：机器学习深度学习假说函数文章标签： CS231n cnn fc-layer activation ReLU

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012767526/article/details/51399596

版权

本文介绍了深度学习中的三种主要激活函数：Sigmoid、tanh和ReLU。Sigmoid虽然历史久远，但在饱和区存在梯度消失问题；tanh输出以零为中心，但计算复杂度高；ReLU因其高效和快速收敛成为首选，但要注意避免死区。文章还提及了ReLU的改进版如Leaky ReLU和Maxout。

摘要由CSDN通过智能技术生成

Fully Connected Neural Network与Activation Function

Fully Connected Neural Network与Activation Function

神经网络–Fully Connect Neural Network

一个最简单的神经网络

一个最简单的神经网络

h w, b = f (x 1 w 1 + x 2 w 2 + x 3 w 3 + b) = f (X W + b)

$h_{w,b}=f(x_1w_1+x_2w_2+x_3w_3+b)=f(XW+b)$
向量化的python代码

def f(z):
    return ReLu（z）

h = f(X.dot(W)+b)

这里 $f$ 是激活函数（Activation Function），我们稍后会讲，这里我们先用ReLu作为激活函数。

让网络更复杂些

这是一个三层的神经网络，第一层称为输入层，最后一层称为输出层，其他层（这里只剩第二层）则为隐藏层，别看好像突然复杂了很多，但是事实并非如此
定义 $W_{i,j}^l$ 为第 $l$ 层的第i个元素的值到第 $l+1$ 层第j个元素的值的权重，因此

最低0.47元/天解锁文章

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。