机器学习算法的主要用途之一就是 预测。通常,使用机器学习算法的流程是
question 》data 》feature 》 algorithm 》 hypothesis 》 evaluation
当数据通过 算法训练得到一个hypothesis之后,我们要用这个hypothesis对新的数据进行预测,那么在此之前,我们先要对这个hypothesis进行评估,判断它是否是一个好的hypothesis。
先约定一些变量
X_train: 用于训练的数据 matrix
Y_train: 用于训练的结果 vector
X_cv: 用于cross validation 的数据matrix
Y_cv: 用于cross validation 的结果vector (ps: cross validation 是用于选择更好的算法参数,从而得到更好的训练结果hypothesis)