吴恩达改善深层神经网络第三周测试题个人记录

最新推荐文章于 2024-07-26 13:24:37 发布

小趴菜日记

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量70

点赞数

文章标签：神经网络人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_55736201/article/details/133820154

版权

问题：每个超参数如果设置得不好，都会对训练产生巨大的负面影响，因此所有的超参数都要调整好，请问这是正确的吗？

ps: 有一些超参数的选择对模型的性能影响较小，或者在某些情况下可以自动调整，如正则化强度、网络层数、隐藏单元数量等。对于这些超参数，选取一个合理的默认值或使用经验规则可能是足够的，不需要进行详细的调参过程

问题：在超参数搜索过程中，你尝试只照顾一个模型（使用熊猫策略）还是一起训练大量的模型（鱼子酱策略）在很大程度上取决于：

A：是否使用批量（batch）或小批量优化（mini-batch optimization）

B：神经网络中局部最小值（鞍点）的存在性

C：在你能力范围内，你能够拥有多大的计算能力（注：就是高性能电脑和低性能电脑的区别）

D：需要调整的超参数的数量

问题：找到好的超参数的值是非常耗时的，所以通常情况下你应该在项目开始时做一次，并尝试找到非常好的超参数，这样你就不必再次重新调整它们。请问这正确吗？

ps：

在项目开始时就尝试找到非常好的超参数并不总是可行的，因为每个具体问题的特点和数据集的不同，最好的超参数组合也会有所不同。

因此，通常建议在项目开始时先进行一次初步的超参数调整，并记录下超参数的范围和结果。然后，在模型训练过程中，可以根据训练结果逐步调整超参数范围和取值，以取得更好的性能。此外，随着时间的推移和学习的积累，我们可能会发现新的超参数配置或方法，可以进一步提高模型性能

A：最佳值是...

B：对于每个层，有一个全局值γ ∈ R和一个全局值β ∈ R ，适用于于该层中的所有隐藏单元。

ps：不同mini-batch每层可以得出不同的γ和β

C：它们可以用Adam、动量的梯度下降或RMSprop，而不仅仅是用梯度下降来学习

D：γ 和β 是算法的超参数，我们通过随机采样进行调整

ps：

γ控制着归一化后的特征缩放比例，影响了特征的表示能力。一般情况下，γ的默认值为1。如果发现模型的学习速度过慢或者特征缩放不足，可以尝试增大γ的值；反之，如果模型的学习速度过快或者特征缩放过大，可以尝试减小γ的值。

β控制着归一化后的偏移量，对于特征的原始分布进行平移。与γ类似，β的默认值为0。如果发现模型的拟合能力不足或者特征偏移较大，可以尝试增大β的值；反之，如果模型的拟合能力过强或者特征偏移较小，可以尝试减小β的值。

可以使用网格搜索或者随机搜索的方法来寻找最佳的γ和β的取值，可以使用动量（Momentum）或者自适应学习率算法（如Adam、RMSprop），这些方法可以自动地调整γ和β的取值

C：它们确定了给定层的线性变量z [ l ] 的均值和方差

问题：在训练了具有批标准化的神经网络之后，在用新样本评估神经网络的时候，您应该

B：执行所需的标准化，使用在训练期间，通过指数加权平均值得出的μ和σ 2

D：如果你在256个例子的mini-batch上实现了批标准化，那么如果你要在一个测试例子上进行评估，你应该将这个例子重复256次，这样你就可以使用和训练时大小相同的mini-batch进行预测。

A：即使一个项目目前是开源的，项目的良好管理有助于确保它即使在长期内仍然保持开放，而不是仅仅为了一个公司而关闭或修改。

C：通过编程框架，您可以使用比低级语言（如Python）更少的代码来编写深度学习算法

B：深度学习编程框架的运行需要基于云的机器

小趴菜日记

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
吴恩达改善深层神经网络第三周测试题个人记录

γ控制着归一化后的特征缩放比例，影响了特征的表示能力。D：如果你在256个例子的mini-batch上实现了批标准化，那么如果你要在一个测试例子上进行评估，你应该将这个例子重复256次，这样你就可以使用和训练时大小相同的mini-batch进行预测。问题：找到好的超参数的值是非常耗时的，所以通常情况下你应该在项目开始时做一次，并尝试找到非常好的超参数，这样你就不必再次重新调整它们。在项目开始时就尝试找到非常好的超参数并不总是可行的，因为每个具体问题的特点和数据集的不同，最好的超参数组合也会有所不同。
复制链接

扫一扫

小趴菜日记 CSDN认证博客专家 CSDN认证企业博客

码龄3年

96: 原创

105万+: 周排名

3万+: 总排名

5万+: 访问

: 等级

1629: 积分

439: 粉丝

641: 获赞

31: 评论

609: 收藏

私信

关注

热门文章

最新评论

nn.LSTM个人记录
假如我年少有为�: 请问这个input size是什么含义呢，输入的特征数量吗
报错The installed version of bitsandbytes was compiled without GPU support. 8-bit optimizers, 8-bit mu
一掬净土: 我看你重新安装的是win版本的，mac上如何处理呢？
nn.LSTM个人记录
xunziyounb: 您好，我在复现音频信号+神经网络的一篇论文的时候也看到了记忆单元的字样，他是这样描述的：时域 CRN 模型包含由六层一维 CNN 构成的编码器，两层 LSTM 层和由六层一维 CNN 构成的解码器。编码器中每层的输出通道数为 [32, 32, 32, 64, 64, 64]，每层的卷积核的大小为 [64, 64, 32, 16, 8, 8]。每层 LSTM 有 64 个记忆单元。解码器中每层的输出通道数为 [64, 64, 32, 32, 32, 1]，每层的卷积核大小为 [8, 8, 16,32, 64, 64]。模型通过 Adam 优化器训练了 50 轮。，请问如果是这样的一个神经网络结构，这里的LSTM的inputsize应该是多少呢？主要是我没明白他这里说的记忆单元是什么意思，但是却和上面编码器最后一层的输出通道数是一样的
InternLM-Chat-7B部署调用-个人记录
木子后更是: 官网点击参加训练营填写信息邀请码就会自动发放到邮箱了
huggingface transformers框架个人记录
ryanchou1: 添加compute_metric之后在验证时会爆显存，有办法避免嘛

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。