李宏毅机器学习笔记（二）

最新推荐文章于 2024-07-19 10:35:10 发布

Bren-Yi

最新推荐文章于 2024-07-19 10:35:10 发布

阅读量1.2k

点赞数

文章标签： ubuntu git 自动驾驶

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Chasinglight/article/details/121403759

版权

（解释：在测试数据集20层network比56层的loss 更小，考虑over fitting(过拟合)的原因？答案是不一定的，要再看看训练集，训练集中20层layer还是比56层低。对于训练集来说，20层能拟合的数据，56层网络(函数更为复杂精细)应该更可以拟合精确使得loss function 的值更小，但现在更大，原因应该不是model bias 的问题，所以应该是optimization issue。也不是过拟合的问题，过拟合主要的现象是在训练集loss小测试集loss大）

Overfitting

解决over fitting方法：

（1）增加训练集

（2）Date augmentation

（3）不要让你的model more flexible

constrain your model

但是不要constrain too much

如果在critical point 是属于Saddle point，那么可以通过找Hessian matrix 的eigenvalue 和eigenvector进行下一步梯度下降。

Full batch：等于没有bach 只update一次参数，时间长

Batch size =1 ：看1个example就update 一次参数

vanilla ：一般的

加上

解释：learning rate大的时候会在local minima的梯度线左右两旁来回反复横跳（可以想象成山谷），learning rate 小的时候可以收敛到minima对于的梯度线上，但由于rate太小，始终无法靠近目标点（“×”）。

为什么要用 warm up的可能解释？

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
李宏毅机器学习笔记（二）

（解释：在测试数据集20层network比56层的loss 更小，考虑over fitting(过拟合)的原因？答案是不一定的，要再看看训练集，训练集中20层layer还是比56层低。对于训练集来说，20层能拟合的数据，56层网络(函数更为复杂精细)应该更可以拟合精确使得loss function 的值更小，但现在更大，原因应该不是model bias 的问题，所以应该是optimization issue。也不是过拟合的问题，过拟合主要的现象是在训练集loss小测试集loss大）...
复制链接

扫一扫

Bren-Yi CSDN认证博客专家 CSDN认证企业博客

码龄5年

9: 原创

61万+: 周排名

176万+: 总排名

1万+: 访问

: 等级

123: 积分

2: 粉丝

15: 获赞

12: 评论

104: 收藏

私信

关注

热门文章

最新评论

Vscode+ROS/ROS2 开发调试基于ROS/ROS2应用环境配置
Bren-Yi: 遇到过，这很可能是你虽然设置的断点位置，但是程序没运行到那个位置。比如设置if条件语句里的代码。
Linex Ubuntu环境下 Intel Realsense D435I 驱动+ROS驱动安装配置
小李285: 最后编译代码的时候，如果src文件夹里面没有ddynamic_reconfigure代码，我这边就提示报错，因为缺少ddy代码。放进去能够编译成功，但是后续启动相机节点的时候直接报错退出。怎么办
Vscode+ROS/ROS2 开发调试基于ROS/ROS2应用环境配置
DzyNg: 您好博主我想问问我的程序在断点中不会停下是否遇到过类似问题
Linex Ubuntu环境下 Intel Realsense D435I 驱动+ROS驱动安装配置
weixin_44021853: gege haoban
一些build source code的经验
CSDN-Ada助手: 非常感谢您分享关于“一些build source code的经验”的博客！恭喜您已经写了第9篇博客，这是一项了不起的成就。您的经验分享对于那些想要学习如何构建源代码的人来说肯定会非常有帮助。在下一步的创作中，我建议您可以进一步扩展您的主题，探索更多与构建源代码相关的细节或技巧。您可以分享一些特定的项目或工具，以及您在解决问题时所采取的方法。这样的创作将更加深入，并对读者产生更大的启发。再次感谢您的分享，期待看到更多关于构建源代码的有趣博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。