(mnist 0 ,2)---81*30*2---(1,0)(0,1)
分类mnist的0和2。让训练集的数量n分别等于5000,4500,4000,3500,3000,2500,2000,1500,1000,500,400,300,200,100,50,40,30,20,10,5,4,3,2共22个值。观察n是如何影响迭代次数的分布的。
让收敛标准δ等于1e-5,数据已经在<神经网络训练集量最少可以是多少个?>里算出来了。
首先观察n=5000的图片
让网络在1e-5处收敛了199次,只有12个不同的迭代次数,其中7604出现了83次。出现了高度简并的现象。
无论n怎么变化都有这种简并现象吗?
当n=2时,有199个不同的迭代次数,迭代次数没有简并现象。
当n=3时,同样有199个不同的迭代次数,没有简并。
当n=4时,有195个不同的迭代次数,其中179751,181035,188895,190863都出现了两次,第一次出现了简并的现象。
当n=5时,有197个不重复的值,174435,175267出现了两次。
当n=10时,有185个不同的值,其中43305和47661个出现了3次,规律明显当n增大时简并度提高。
当n=20时,有167个不同的值。
当n=30时,有141个不同的值。
当n=40时,有102个不同的值。其中13270出现了10次。
当n=50时,有71个不同的值。
当n=100时,有27个不同的值,
7086 | 7284 | 7482 | 7680 | 7878 | 8076 | 8274 | 8472 | 8670 | 8868 | 9066 | 9264 | 9462 | 9660 | 9858 | 10056 | 10254 | 10452 | 10650 | 10848 | 11046 | 11244 | 11442 | 11640 | 12828 | 13224 | 15798 |
198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 198 | 1188 | 396 | 2574 |
这27个值的差值都是198的倍数。
当n=200时,只有14个不同的值
4668 | 4682 | 5066 | 5080 | 5464 | 5478 | 5862 | 5876 | 6260 | 6274 | 6658 | 6672 | 7056 | 7454 |
14 | 384 | 14 | 384 | 14 | 384 | 14 | 384 | 14 | 384 | 14 | 384 | 398 |
这14个值只有14,384,398这3个间距。
当n=300时,只有14个不同的值,
5088 | 5672 | 5686 | 6270 | 6284 | 6868 | 6882 | 7094 | 7466 | 7480 | 8064 | 8078 | 8290 | 8662 |
584 | 14 | 584 | 14 | 584 | 14 | 212 | 372 | 14 | 584 | 14 | 212 | 372 |
出现了14,212,372,584共4个间距
当n=400时,有11个不同的值,
当n=500时,有18个不同的值。
当n=1000时,有12个不同的值
当n=1500时,有17个不同的值
当n=2000时,有16个不同的值。
当n=2500时,有13个不同的值
当n=3000时,有14个不同的值
当n=3500时,有10个不同的值
当n=4000时,有7个不同的值
当n=4500时,有13个不同的值。
统计迭代次数不同值的数量对n的变化
n | 5000 | 4500 | 4000 | 3500 | 3000 | 2500 | 2000 | 1500 | 1000 | 500 | 400 | 300 | 200 | 100 | 50 | 40 | 30 | 20 | 10 | 5 | 4 | 3 | 2 |
不同值的数量 | 12 | 13 | 7 | 10 | 14 | 13 | 16 | 17 | 12 | 18 | 11 | 14 | 14 | 27 | 71 | 102 | 141 | 167 | 185 | 197 | 195 | 199 | 199 |
很明显10<=n<=200,是迭代次数的分布的过度区间,当n>200个以后迭代次数不同值就维持在约13个,在前文<神经网络训练集量最少可以是多少个?>已经证实5000到200随着n的减小迭代次数减小,n=200应该是保持这个网络基本特征的最小n值。
而光谱的等距变化区间就出现在过度区间,因此神经网络光谱随着n的增加,由等距变化变为不等距变化。