手动深度学习

多层感知机作业-mlp-scratch

  1. 目录

    1.在所有其他参数保持不变的情况下,更改超参数`num_hiddens`的值,并查看此超参数的变化对结果有何影响。确定此超参数的最佳值。

    2.  尝试添加更多的隐藏层,并查看它对结果有何影响。

    3. 改变学习速率会如何影响结果?保持模型架构和其他超参数(包括轮数)不变,学习率设置为多少会带来最好的结果?

    4.  通过对所有超参数(学习率、轮数、隐藏层数、每层的隐藏单元数)进行联合优化,可以得到的最佳结果是什么?

    5. 描述为什么涉及多个超参数更具挑战性。

    6. 如果要构建多个超参数的搜索方法,你能想到的最聪明的策略是什么?


 1.更改超参数‘num_hiddens’

在学习率不变和训练次数不变的情况下,增加隐藏单元的数量,train loss 会明显降低 test acc 曲线也会更加平滑
 

                                                                num_hiddens=64

                                                                 num_hiddens=128

                                                                 num_hiddens=256

                                                                 num_hiddens=512

                                                                 num_hiddens=1024

2. 添加隐藏层数 

  • 注意点:添加隐藏层后(代码中为2个隐藏层)需要

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值