深度学习模型的交叉验证方法,是为了测试两种不同的模型结构的优势,而不是测试一种模型到什么时候收敛,初学的时候弄混了。
交叉验证是为了避免随机性给模型带来的对比不公平的情况,所以在各种训练数据和测试数据的安排下对不同的模型结构进行多次训练和选择,求均值和方差之后进行对比。
交叉验证有以下几种方法:
随机分为7:3
k折
留一:这种实在数据非常非常少的时候用的。
一个attention的pytorch的实现的记录和参考吧。
https://xiaosheng.run/2022/06/28/use-pytorch-to-implement-transformer.html