[机器学习]如何选择模型--cross validation

本文探讨了在机器学习中如何选择模型,主要关注特征选择、算法选取和参数设定。通过介绍交叉验证的概念,如使用训练数据集D_train、测试数据集D_cv,以及K折交叉验证的方法,阐述了如何评估和选择最佳模型。Andrew Ng的建议是将数据分为训练、交叉验证和测试集,并推荐使用5折或10折交叉验证来确保模型的泛化能力。
摘要由CSDN通过智能技术生成

 对于一个机器学习系统,有以下几个问题需要解决:

1,如何选择feature?

2,该选用哪个算法?

3,给这个算法设置怎样的参数?

这些问题合在一起,就是“如何选择模型”的问题。


例如:可以实现分类系统的算法有 one-vs-all logistic regression,neural network,SVM等等,我们该用哪一个。


要解决个这个问题,我们就要用不同的组合(包括算法,参数,feature)对数据D_train进行training,得到不同的model。

要对这些model做测试,需使用新的数据D_cv。然后,对model的分类预测结果做一个评价(

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值