基本思想:将数据分为训练集合和测试集合,用训练集合的数据训练模型,用测试集合的数据测试模型。训练集和测试集的划分,可以是按照时间的维度,也可以按照人群的维度。
存在风险:对于某些方法可能有偏向性。
用历史数据进行评价
按照时间维度将数据分为训练集合测试集,N折交叉验证。
还有直接用人工进行评价的。不过代价较大,不能上规模,在实际中用处不大。
完。
还有直接用人工进行评价的。不过代价较大,不能上规模,在实际中用处不大。
完。