神经网络训练需要联网吗,神经网络训练样本太少

最新推荐文章于 2022-10-08 10:59:10 发布

vvccyyqq

最新推荐文章于 2022-10-08 10:59:10 发布

阅读量938

点赞数

分类专栏： html 文章标签：神经网络深度学习人工智能

原文链接：http://www.xiaofamao.com/jishu/41.html

版权

html 专栏收录该内容

187 篇文章 2 订阅

订阅专栏

神经网络100条的训练样本用隐含层节点数比如20，表现好！现在3000条训练样本用20可以嘛？

谷歌人工智能写作项目：小发猫

200组数据可以训练神经网络吗

求已知20个数，怎么预测第21个数，使用matlab神经网络！高手求解啊 20

20个点太少了，可以做，但是误差非常大。另外你这个明显是外推，随机性大的不可想象。用matlab作法很简单，首先建立训练样本。从1-19作为输入，2-20作为输出。

比如你的样本命名为sample;sample必须是一行多列，当然这个仅对于你这个样本。

Input=sample(1,1:19);Target=sample(1,2:20);net=newff(Input,Target,5);%这里的5，是节点数量，你这点样本，用5个其实也比较多了。

net.divideFcn='';%你的样本太少，就不要抽样检测了。

net=train(net,Input,Target);output=sim(net,Target(19));%把最后一个已知量输进去，预测下一个。这样可以预测。但是误差会很大很大。

看你这个架势，预测彩票啊？

神经网络对样本个数有要求么？

神经网络对输入变量个数有没有要求，六十个可以吗？

可以，但是网络规模太大，很臃肿，需要调整的参数过多，影响收敛速度。

关于隐层节点数：在BP网络中，隐层节点数的选择非常重要，它不仅对建立的神经网络模型的性能影响很大，而且是训练时出现“过拟合”的直接原因，但是目前理论上还没有一种科学的和普遍的确定方法。

目前多数文献中提出的确定隐层节点数的计算公式都是针对训练样本任意多的情况，而且多数是针对最不利的情况，一般工程实践中很难满足，不宜采用。事实上，各种计算公式得到的隐层节点数有时相差几倍甚至上百倍。

为尽可能避免训练时出现“过拟合”现象，保证足够高的网络性能和泛化能力，确定隐层节点数的最基本原则是：在满足精度要求的前提下取尽可能紧凑的结构，即取尽可能少的隐层节点数。

研究表明，隐层节点数不仅与输入/输出层的节点数有关，更与需解决的问题的复杂程度和转换函数的型式以及样本数据的特性等因素有关。

在确定隐层节点数时必须满足下列条件：（1）隐层节点数必须小于N-1（其中N为训练样本数），否则，网络模型的系统误差与训练样本的特性无关而趋于零，即建立的网络模型没有泛化能力，也没有任何实用价值。

同理可推得：输入层的节点数（变量数）必须小于N-1。(2)训练样本数必须多于网络模型的连接权数，一般为2~10倍，否则，样本必须分成几部分并采用“轮流训练”的方法才可能得到可靠的神经网络模型。

总之，若隐层节点数太少，网络可能根本不能训练或网络性能很差；若隐层节点数太多，虽然可使网络的系统误差减小，但一方面使网络训练时间延长，另一方面，训练容易陷入局部极小点而得不到最优点，也是训练时出现“过拟合”的内在原因。

因此，合理隐层节点数应在综合考虑网络结构复杂程度和误差大小的情况下用节点删除法和扩张法确定。

BP神经网络的训练集需要大样本吗？一般样本个数为多少？

BP神经网络样本数有什么影响学习神经网络这段时间，有一个疑问，BP神经网络中训练的次数指的网络的迭代次数，如果有a个样本,每个样本训练次数n，则网络一共迭代an次，在n>>a情况下，网络在不停的调整权值，减小误差，跟样本数似乎关系不大。

而且，a大了的话训练时间必然会变长。换一种说法，将你的数据集看成一个固定值，那么样本集与测试集也可以按照某种规格确定下来如7：3所以如何看待样本集的多少与训练结果呢？

或者说怎么使你的网络更加稳定，更加符合你的所需。

我尝试从之前的一个例子中看下区别如何用70行Java代码实现深度神经网络算法作者其实是实现了一个BP神经网络，不多说，看最后的例子一个运用神经网络的例子最后我们找个简单例子来看看神经网络神奇的效果。

为了方便观察数据分布，我们选用一个二维坐标的数据，下面共有4个数据，方块代表数据的类型为1，三角代表数据的类型为0，可以看到属于方块类型的数据有（1，2）和（2，1），属于三角类型的数据有（1，1），（2，2），现在问题是需要在平面上将4个数据分成1和0两类，并以此来预测新的数据的类型。

图片描述我们可以运用逻辑回归算法来解决上面的分类问题，但是逻辑回归得到一个线性的直线做为分界线，可以看到上面的红线无论怎么摆放，总是有一个样本被错误地划分到不同类型中，所以对于上面的数据，仅仅一条直线不能很正确地划分他们的分类，如果我们运用神经网络算法，可以得到下图的分类效果，相当于多条直线求并集来划分空间，这样准确性更高。

图片描述简单粗暴，用作者的代码运行后训练5000次。

根据训练结果来预测一条新数据的分类（3,1）预测值（3,1）的结果跟（1,2）（2,1）属于一类属于正方形这时如果我们去掉2个样本，则样本输入变成如下//设置样本数据，对应上面的4个二维坐标数据double[][]data=newdouble[][]{{1,2},{2,2}};//设置目标数据，对应4个坐标数据的分类double[][]target=newdouble[][]{{1,0},{0,1}};12341234则（3,1）结果变成了三角形，如果你选前两个点你会发现直接一条中间线就可以区分这时候的你的结果跟之前4个点时有区别so你得增加样本直到这些样本按照你所想要的方式分类，所以样本的多少重要性体现在，样本得能反映所有的特征值（也就是输入值），样本多少或者特征（本例子指点的位置特征）决定的你的网络的训练结果，！

！！这是我们反推出来的结果。这里距离深度学习好像近了一步。另外，这个70行代码的神经网络没有保存你训练的网络，所以你每次运行都是重新训练的网络。

其实，在你训练过后权值已经确定了下来，我们确定网络也就是根据权值，so只要把训练后的权值保存下来，将需要分类的数据按照这种权值带入网络，即可得到输出值，也就是一旦网络确定，权值也就确定，一个输入对应一个固定的输出，不会再次改变！

个人见解。

最后附上作者的源码，作者的文章见开头链接下面的实现程序可以直接拿去使用，import.Random;publicclassBpDeep{publicdouble[][]layer;//神经网络各层节点publicdouble[][]layerErr;//神经网络各节点误差publicdouble[][][]layer_weight;//各层节点权重publicdouble[][][]layer_weight_delta;//各层节点权重动量publicdoublemobp;//动量系数publicdoublerate;//学习系数publicBpDeep(int[]layernum,doublerate,doublemobp){=mobp;=rate;layer=newdouble[layernum.length][];layerErr=newdouble[layernum.length][];layer_weight=newdouble[layernum.length][][];layer_weight_delta=newdouble[layernum.length][][];Randomrandom=newRandom();for(intl=0;l。

rbf神经网络的训练样本要多大

因课题而异。1、样本最关键在于正确性和准确性。你所选择的样本首先要能正确反映该系统过程的内在规律。

我们从生产现场采得的样本数据中有不少可能是坏样本，例如由于测量仪器故障导致测量数据误差较大等，这样的样本会干扰你的神经网络训练。

通常我们认为坏样本只是个别现象，所以我们希望通过尽可能大的样本规模来抵抗坏样本造成的负面影响。2、其次是样本数据分布的均衡性。你所选择的样本最好能涉及到该系统过程可能发生的各种情况。

例如某化工生产中某反应炉的温度主要分布在350度—400度，且出现在380度的情况较多，那么你的样本数据最好也是在350-400度各种情况都有，并且也是在380度左右的样本较多些，这样可以极大可能的照顾到系统在各个情况下的规律特征。

通常我们对系统的内在规律不是很了解，所以我们希望通过尽可能大的样本规模来“地毯式”覆盖对象系统的方方面面。3、再次就是样本数据的规模，也就是你要问的问题。

在确保样本数据质量和分布均衡的情况下，样本数据的规模决定你神经网络训练结果的精度。样本数据量越大，精度越高。

还用刚才的例子，假如反应炉的温度主要均匀分布在375-385度之间，那么你用100个均衡分布在375-385度的训练样本去训练，经过无限次或者说是足够多次迭代之后，理论上你的神经网络的精度就是0.1度。

如果你觉得0.1度足够细腻了，那么样本规模为100也就可以接受了。由于样本规模直接影响计算机的运算时间，所以在精度符合要求的情况下，我们不需要过多的样本数据，否则我们要等待很久的训练时间。

补充说明一下，不论是径向基（rbf）神经网络还是经典的bp神经网络，都只是具体的训练方法，对于足够多次的迭代，训练结果的准确度是趋于一致的，方法只影响计算的收敛速度（运算时间），和样本规模没有直接关系。

神经网络训练样本越多是不是泛化能力越好？

这个没有明确要求，样本也不是越多越好。通常情况下，你的样本可以一部分用来做验证。加速你有100个样本，90%用来做训练，10%用来做验证等，当然，有时候还得留下10%做测试用。

我个人的经验是，样本数尽量在10以上吧。

神经网络学习样本越多，泛化能力越强？

是的。构复杂性和样本复杂性：神经网络的容量以及规模称之为神经网络的结构复杂性，样本复杂性是训练某一固定结构神经网络所需的样本数目。

样本质量是训练样本分布反映总体分布的程度，或者说由整个训练样本集提供的信息量。样本质量可以强烈地影响神经网络的泛化能力，改进训练样本质量，也是改善神经网络泛化能力的一种重要方法。

扩展资料：注意事项：由于学习速率是固定的，因此网络的收敛速度慢，需要较长的训练时间。

对于一些复杂问题，BP算法需要的训练时间可能非常长，这主要是由于学习速率太小造成的，可采用变化的学习速率或自适应的学习速率加以改进。

BP算法可以使权值收敛到某个值，但并不保证其为误差平面的全局最小值，这是因为采用梯度下降法可能产生一个局部最小值。对于这个问题，可以采用附加动量法来解决。

参考资料来源：百度百科-神经网络结构参考资料来源：人民网-DeepMind出IQ测试题考考神经网络有多聪明。

vvccyyqq

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
神经网络训练需要联网吗,神经网络训练样本太少

为了方便观察数据分布，我们选用一个二维坐标的数据，下面共有4个数据，方块代表数据的类型为1，三角代表数据的类型为0，可以看到属于方块类型的数据有（1，2）和（2，1），属于三角类型的数据有（1，1），（2，2），现在问题是需要在平面上将4个数据分成1和0两类，并以此来预测新的数据的类型。补充说明一下，不论是径向基（rbf）神经网络还是经典的bp神经网络，都只是具体的训练方法，对于足够多次的迭代，训练结果的准确度是趋于一致的，方法只影响计算的收敛速度（运算时间），和样本规模没有直接关系。但是误差会很大很大。
复制链接

扫一扫

专栏目录