数据归一化:
所谓数据归一化就是把数据的取值范围处理至0-1或者-1-1之间
防止窄长图
任意数据转化为0-1之间
newValue = (oldValue - min)/(max-min)
任意数据转化为-1-1之间
newValue = ((value-min) / (max - min) - 0.5)*2
均值归一化:
newValue = (oldValue-u)/s
其中u为平均值 s为方差
(1,3,5,7,9)
u = (1 + 3 +5 + 7+ 9) / 5 = 5
s = ( (1-5)2+(3 - 5)2 + (5 - 5)2+(7-5)2+(9-5)2 )/5 = 8
交叉验证法
是一种测试的方法.
以每次的蓝色小方块作为测试集,其余作为训练集,测试十次,计算每次的误差,最后累加起来求平均值,作为最后误差的输出,当然只是阐述其中的思想,至于怎么分配比例,还要看自己的需求
有时候数据量不够,数据量比较小,可以使用这种方式