一般用随机百分之七十的数据当作训练集,随机百分之三十的数据当作测试集
使用线性回归和平方差标准时测试误差的定义
考虑分类问题使用逻辑回归时
计算出其在测试集中的性能从而选择最好的参数模型
为了寻找最好的参数模型,要把数据分为训练集(60%),交叉验证集(20%),测试集 (20%),然后用验证集来选择模型,选择交叉验证误差最小的模型来当参数模型,这样就可以用测试集来估计所选模型的泛化误差了
训练误差、交叉验证误差和测试误差
一般用随机百分之七十的数据当作训练集,随机百分之三十的数据当作测试集
使用线性回归和平方差标准时测试误差的定义
考虑分类问题使用逻辑回归时
计算出其在测试集中的性能从而选择最好的参数模型
为了寻找最好的参数模型,要把数据分为训练集(60%),交叉验证集(20%),测试集 (20%),然后用验证集来选择模型,选择交叉验证误差最小的模型来当参数模型,这样就可以用测试集来估计所选模型的泛化误差了
训练误差、交叉验证误差和测试误差