虽然已经把数据集分为Training set和Validation set,为什么还是会Overfitting??
我们是先从D-train训练得到参数h,之后用D-val进行Loss的评价,最终选择最合适的Model进行test
其实你想想,这一过程不也是一个train吗
我们的目的就是挑选出L小的h*。H-val只有三个选择,并用D-val这一数据集进行train
记得之前讲过,我们为了控制bad的概率最小,减少H复杂度以及增加N就可以
那么D-val同理,当我们的H-val太大,N-val太小,依然可能overfitting。