机器学习之交叉验证(cross-validation,CV)

机器学习之交叉验证(cross-validation,CV)

人和计算机的主要区别在于人可以对问题进行思考,而计算机只会计算。从AI角度来看,人们将大量无序嘈杂的数据简单清洗之后喂(feed)给计算机,训练使其得出含参数的模型,在模型的基础上,利用数据对模型的参数进行估计,通过参数化后的模型来描述数据的内在关系(pattern),从而以一个科学(maybe哲学~)的角度预测未来。

在对模型的选择上,可用的模型若干,不存在所谓最优解,我们只能认为对于某个确切问题来说,某个模型的解释能力更强。即使对于同一问题而言,在不同的评价标准下,之前最好的模型可能就不再适用。

在选择具有最好的预测能力的模型中,一个评价标准叫做比较各个模型对数据的拟合效果。数据分析最重要的目的就是预测数据,所以在拟合效果(可能over-fitting)和预测误差(要求high-accuracy)两者的权衡之中,需要找到一种平衡,交叉验证就是基于这样的考虑。

下述是几种交叉验证的方法:

1).Hold-Out Method
将原始数据随机分为两组,一组做为训练集,一组做为验证集,利用训练集训练分类器(classifier),然后利用验证集验证模型,记录最后的分类准确率为此Hold-Out Method下分类器的性能指标。
此种方法:
##优点是处理简单,只需随机把原始数据分为两组即可。
##缺点是由于是随机的将原始数据分组,所以最后验证集分类准确率的高低与原始数据的分

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值