70%用于训练集,30%用于测试集。 如果想要加入验证集,划分标准可以改为60%/20%/20%,也就是将数据集的60%用于训练集,20%用于测试集,20%用于验证集。 对于百万级别的数据集,可以采用98%/1%/1%的规则来划分数据集。