台大李宏毅

最新推荐文章于 2024-04-18 17:45:05 发布

超人妈妈

最新推荐文章于 2024-04-18 17:45:05 发布

阅读量560

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41078740/article/details/84522502

版权

1：Regression-Case Study

为什么在Loss function中，只考虑对w的正则化，而不考虑对b的正则化？

因为b是一条水平线，b对Loss function是否平滑几乎不产生影响。

1-Regression Demo

Ada-Gradient时会详细讲解这个技巧：小的learning rate导致要很多次迭代才能达到最优解，大的learning rate有可能会有巨幅震荡，也无法达到最优解。有一个调参的技巧，就是对w和b克制化的learning rate。

lr = 1

....................................

lr_b = 0

lr_w = 0

....................................

lr_b = lr_b + b_grad ** 2

lr_w = lr_w + w_grad ** 2

.................................

# update parameters.

b = b - lr/np.sqrt(lr_b)* b_grad

w = w- lr/np.sqrt(lr_w)* w_grad

2：Where does the error come from？

error due to “bias” and error due to “variance”。

简单的model（model set比较小，这个小的model set可能根本不包含真实的target model），bias大，variance小；

复杂的model（model set比较大，这个大的model set可能就包含真实的target model），bias小，variance大。

如果error来自于variance很大，那么就是overfitting；

如果error来自于bias很大，那么就是underfitting；

What to do with large bias?

1、Diagnosis:

(1) If your model cannot even fit the training examples, then you have large bias.----> Underfitting.

(2) If you can fit the training data, but large error on testing data, then you probably have large variance. ----> Overfitting.

2、For bias, redesign your model:

(1) Add more features as input;

(2) A more complex model

What to do with large variance?

1、 More data（very effective, but not always practical）可以自己做训练数据，例如翻转、加噪声等。

2、 Regularization (希望参数变化较小，曲线变平滑)，但是可能会使你的model set 不包含target model，可能会伤害bias。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
台大李宏毅

1：Regression-Case Study为什么在Loss function中，只考虑对w的正则化，而不考虑对b的正则化？因为b是一条水平线，b对Loss function是否平滑几乎不产生影响。 1-Regression DemoAda-Gradient时会详细讲解这个技巧：小的learning rate导致要很多次迭代才能达到最优解，大的learning rate有可能...
复制链接

扫一扫

超人妈妈 CSDN认证博客专家 CSDN认证企业博客

码龄7年

23: 原创

75万+: 周排名

162万+: 总排名

1万+: 访问

: 等级

359: 积分

19: 粉丝

6: 获赞

6: 评论

8: 收藏

私信

关注

热门文章

分类专栏

最新评论

git项目学习笔记--FastMaskRCNN-master
LFting0721: 你好，想问一下有没有fast mask-rcnn的详细解读文档，这个与mask-rcnn有什么区别
ros python 20210202
lunvey: 给大佬递茶，期待后续，望有空互粉互访点赞!
台大李宏毅
梦想橡皮擦: 讲解的很清晰明了
tensorflow installation guide
超人妈妈: STEP II : install CUDA 的 5. gedit ./.bashrc，请注意bashrc文件在home路径下，所以需要进入home路径，打开bashrc文件进行编辑。
tensorflow installation guide
超人妈妈: 首先sudo apt update，然后sudo apt upgrade

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。