对于一个机器学习问题,我们通常有数据集D(用于训练模型),但我们还需要评估模型,因此不能把整个D用于训练,因为拿训练过的数据再去评估必然无效。那么最基本的方法就是留出法: 把D划分为两部分:训练集S和测试集T,其中SUT=D,S∩T=Φ。