神经网络中隐藏层的层数和隐藏层节点数的确定

最新推荐文章于 2025-03-12 09:20:14 发布

鹿与狼

最新推荐文章于 2025-03-12 09:20:14 发布

阅读量4.2w

点赞数 32

文章标签：神经网络人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36370187/article/details/103025113

版权

1.隐藏层的层数

一般来说，层数越多，整个网络的误差也就越小，但是会是整个网络复杂化，增加网络的训练时间，也有可能出现“过拟合”（太适应于训练集，在测试集上效果不好）的情况。一般来说，一两层的隐藏层已经能够解决很多问题了，如果数据量多，可以在防止出现过拟合的情况下适当的增加层数。

2.隐藏层节点数

隐藏层节点数是导致“过拟合”的直接原因，确定隐藏层节点数与输入输出维度相关，并且每个模型都是不一样的。目前来说，确定隐藏层节点数也是比较困难的，但是必须满足以下两个条件：

1.隐藏层的节点数必须小于n-1，其中n是训练样本数量。如果节点数不满足这个条件，那么平均下来，每个节点甚至控制不到一个样本，这样子会造成样本与误差相关性小，使得网络泛化能力不行（用新的数据来评估效果就是不好），整个网络没啥意义。
2.同样，输入层的节点也要小于n-1，理由同上。（虽然这个不是属于隐藏层，输入输入层，但是由于和隐藏层节点相似，也提一下）
3.训练的样本数量必须多于网络模型中的参数，一般要求是2-10倍。样本数量实在不够，那就采取别的方法来增加训练数量，比如K倍交叉法来进行。

总结：针对不同的模型，隐藏层的层数以及隐藏层节点数是不同的，需要考虑输入输出的维度、网络的复杂度、训练样本数量、误差大小等等因素。节点数少了，模型不具有泛化能力，没啥效果；节点多了，容易陷入局部最优（某几个样本相似，然后整个网络往这几个样本靠拢），甚至出现过拟合。

博客等级

码龄9年

100
原创

83
点赞

345
收藏

26
粉丝

关注

私信

分类专栏

Java虚拟机 19篇
MyBatis 7篇

最新评论

JVM系列（十六）：Class文件结构
hao9e: 引用「结果：」这个结果不对吧，我本地试了一下是10,30,20。而且这里面打印了两个Son.x
JVM系列（二）：类加载子系统
hao9e: 引用「类常量（static final）在编译时将其要赋予的值存储在常量池中，在准备阶段将常量值指定为常量」这里面的"常量值"指的是什么？我看第四章也有提到。我看作者的意思是常量池中的"常量值"和"常量池中存储的值"是同一个意思。但是我理解的是元空间里面类中该字段所对应的元数据。
JVM系列（三）：程序计数器（PC寄存器）
hao9e: 引用「为什么使用PC寄存器记录当前线程执行地址」这里应该是指令寄存器(IR)存放的当前的执行地址吧？参阅资料如下：CPU中有若干寄存器，保存当前正在执行的指令的寄存器为指令寄存器IR，保存下一条指令地址的寄存器为程序计数器PC，用于存放存储器中数据和指令地址的寄存器是地址寄存器，存数据和指令的寄存器是数据寄存器
JVM系列（三）：程序计数器（PC寄存器）
hao9e: 引用「程序计数器里面记录的是当前线程正在执行的那一条字节码执行的地址。」这里其他文章都说是下一条jvm指令
pytorch函数中的dilation参数的作用
Coding-Prince: 膨胀卷积

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。