深度学习理论入门——网络构建

洞幺洞幺0101

已于 2023-07-26 02:38:29 修改

阅读量123

点赞数 1

文章标签：华为云深度学习人工智能

于 2023-07-07 17:17:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_73101038/article/details/131600589

版权

网络模型构建

想要性能构建良好的网络模型，需要选择合适的神经网络

对特征提取具有高效性
数据格式具有简易性
参数数目具有少量性

其中，对于图像和视频数据，选择卷积神经网络较为合适；对于语音和文本数据（序列数据），选择循环神经网络较为合适

超参数设置

超参数

无法从学习中得到，需要由人根据经验而定，如算法学习率、梯度下降法循环数量、隐藏层数目、单元数目等

调参策略

网络调参方向：更深的网络和更加复杂的结构
目的：提高泛化能力

正则化
增加神经网络层数
使用正确的代价函数
使用好的权重初始化技术
人为拓展训练集
弃权技术

提升CNN泛化能力：

使用更多数据
使用更大批次
调整数据分布
调整目标函数
调整网络结构
数据增强
权值正则化

激活函数和损失函数选择

CNN激活函数

ReLU：

对线性函数，表达很强；对非线性函数，梯度为常数，无梯度消失
增大了网络的稀疏性（单侧抑制）
运算量小

注意事项
若后层某层梯度较大，则导致权重更新后较大，该层输入为负且输出为0，该层死亡则应对学习率有适当设置

Leaky ReLu：
损失了一定的稀疏性，增加了一个超参数a，以达到优化ReLU死亡特性
Max Out：
大大增加了参数量

RNN激活函数

在RNN中，若采用ReLU，则会导致输出值过大，且无法解决梯度在长时间传递的问题，于是采用Tanh函数
在这里插入图片描述

CNN损失函数

分类：交叉熵损失函数
回归：L1，L2损失函数
作用：逐像素比较差异，避免正负值相互抵消，可对像素之差取绝对值或平方
在这里插入图片描述

RNN损失函数

交叉熵损失函数：

在 $t$ 时刻的损失函数如下：
$Loss_t=-[y_t\ln(O_t)+(1-y_t)\ln(1-O_t)]$
全部 $N$ 个时刻（全局）损失函数：
$Loss=\sum^N_{t=1}Loss_t=-\sum^N_{t=1}[y_t\ln (O_t)+(1-y_t)\ln(1-O_t)]$

洞幺洞幺0101

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

洞幺洞幺0101 CSDN认证博客专家 CSDN认证企业博客

码龄2年

5: 原创

167万+: 周排名

213万+: 总排名

916: 访问

: 等级

91: 积分

1: 粉丝

1: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

最新评论

深度学习神经网络构建中的初始化和参数调节
CSDN-Ada助手: 恭喜您写了第5篇博客！标题中的"深度学习神经网络构建中的初始化和参数调节"听起来非常有趣，我迫不及待地想阅读您的文章了。不过我也想提醒您，深度学习是一个庞大而复杂的领域，初始化和参数调节只是其中的一小部分，还有很多其他的话题需要探索。希望您能在未来的博客中继续分享更多关于深度学习的知识和经验，让我们一起不断学习进步吧！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。