机器学习算法评估与优化策略

本文探讨了机器学习算法的评估和优化策略,包括数据集划分、误差分析、诊断偏差和方差问题以及学习曲线的应用。针对高偏差和高方差,提出了相应的解决方案,并讨论了查全率和查准率在评估中的作用。
摘要由CSDN通过智能技术生成

机器学习算法评估与优化策略

1 机器学习诊断

1.1 数据集

  • 训练集70%-测试集30%
    通过训练集让我们的模型学习得出其参数后,对测试集运用该模型。

  • 训练集60%-交叉验证集20%-测试集20% ✓ \checkmark
    假设我们要在10个不同次数的二项式模型之间进行选择,模型选择的方法为:

  1. 使用训练集训练出10个模型
  2. 用10个模型分别对交叉验证集计算得出交叉验证误差
  3. 选取代价函数值最小的模型
  4. 用步骤3中选出的模型对测试集计算得出推广误差
  • 对于比较大的数据集 (如10000000) ,只需保证交叉验证集和测试集各有10000个样本,其余都作为训练集

1.2 误差

  1. 对于回归模型,我们可以计算 代价函数 J J J (未正则化)

  2. 对于分类模型,我们除了可以计算 代价函数 J J J (未正则化) 外,还可以计算测试集 误分类比率.
    当分类出现了既不希望出现的错误分类 (如在识别猫的例子中,把porn标记为了猫),那么可以适当修改误差指标,加大对porn的误差惩罚权重:
    e r r o r = 1 ∑ ω i ∑ ω i I { y ^ i ≠ y i } , ω i = { 1 x i   i s   n o t   p o r n 10 ,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值