一、模型评估
经过前面一系列的操作,我们得到了一个模型,但是如何评价这个模型好还是不好呢?
很简单,用数据测试一下。==>引发2个问题:数据从何而来?评价指标是什么?
【1】测试数据:测试集、校验集
(1)误差越小,模型越好。
(2)在校验集中,数据量不是很大时,会采用k折交叉验证。每折都会计算出一个超参数,最后超参数取平均值。
(3)sklearn中,交叉验证和网格搜索合并为一个参数:sklearn.model_selection.GridSearchCV。
只不过在线性模型中,留一交叉验证效果更好。在sklearn中,RidgeCV(岭回归)、LassoCV都是留一交叉验证。
(4)sklearn 还提供一个与LassoCV类似的LARS&