1.问题引入
基于一些已知样本,根据其变量(是否出现胸痛、是否有良好的血液循环、是否有闭锁的动脉、体重指标),预测其是否患有心脏病(左侧)。接着,出现一个新来的患者,我们可以测量或询问这些变量,然后基于这些变量预测其是否患有心脏病(右侧)。
2.交叉验证法的作用
要回答上面的问题,首先需要决定使用哪种机器学习方法。可供选择的机器学习算法有很多种,如logistic回归(logistic regression)、K-最近邻居法(K-nearest neighbors)、支持向量机(SVM)等等。但是我们应该选择哪种方法呢?
交叉验证法能帮助我们实现多种机器学习方法的比较,并有助于我们了解这些方法在实际数据中的性能。