类神经网络训练不起来怎么办

最新推荐文章于 2022-11-24 01:51:47 发布

bolite

最新推荐文章于 2022-11-24 01:51:47 发布

阅读量427

点赞数 1

分类专栏： NLP 文章标签：神经网络深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bolite/article/details/125965800

版权

NLP 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

内容取自李宏毅2021/2022春机器学习课程p18-22
在这里插入图片描述

当你的Loss值太大时候

1.有可能是模型构造有问题

在这里插入图片描述
可能模型构造的太简单，导致我们需要的模型不在训练的范围之内。
我们可以重新设计我们的模型，增加模型的弹性：1.增加更多的feature（特点，数据），2.增加更多层数

2.可能是优化过程出现问题

在这里插入图片描述
我们取的θ并不是真正最小的那个θ
在选出最小的θ的时候会遇到局部最小值和鞍点的问题

我们需要通过Hessian来区分到底那个θ局部最值还是鞍点

如果我们红色方框内的值一直大于0，就表示当前的θ是局部最小值
如果我们红色方框内的值一直小于0，就表示当前的θ是局部最大值
如果我们红色方框内的值有的大于0有的小于0，则是鞍点。
在这里插入图片描述
当我们处在鞍点的时候，只要找到θ=θ’+u就可以让Loss变小。
所以我们遇到鞍点的时候可以比较轻松的解决优化问题，在大部分情况下，如果我们遇到的是局部最值的时候，在我们当前的维度上看可能是局部最值问题，如果我们放在更高的维度上看待的时候，他可能就变成了一个鞍点的情况

gradient descent+moment技术

在这里插入图片描述
每次取g的反方向于上一次移动的方向进行向量和求出这一次移动的方向

常用的optimization：Adam 可以直接调用

from keras.optimizers import Adam

当你的train的Loss值是小的，但是test的Loss值大

Overfitting

解决Overfitting的俩种方法：1.增加训练数据，2.增加约束条件

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。