华为云HCIA-AI学习记录004-机器学习的整体流程(下)

本文探讨了机器学习中模型的泛化能力、可解释性、预测速率和可塑性等关键因素。深入分析了泛化误差、训练误差、欠拟合与过拟合的概念,以及模型容量对学习效果的影响。同时,介绍了模型性能评估中的偏差和方差,并通过低偏差低方差、低偏差高方差、高偏差低方差和高偏差高方差四种情况解释模型的优劣。最后,简述了分类问题中正负元组、真正例、真负例、假正例和假负例等术语。
摘要由CSDN通过智能技术生成

模型构建项目整体流程
有监督学习
学习阶段——》预测阶段
什么是好的模型?
泛化能力:
能否在实际的业务数据也能准确预测
可解释性
预测的结果是否容易被解释
预测速率
每条数据的预测需要多长时间
可塑性
实际业务过程中数据量可能很大,随着业务量增大,预测的速率是否仍然可以接受
模型的有效性
泛化能力:
机器学习的目标是使学得的模型能够很好的适用于新的样本,而不是仅仅在训练样本上工作的很好,学得的模型适用于新样本的能力称为泛化能力,也称为鲁棒性。
误差:
学习到的模型在样本上的预测结果与样本的真实结果之间的差。
训练误差:模型在训练集上的误差。
泛化误差:在新样本上的误差,显然我们更希望得到泛化误差小的模型。
欠拟合:如果训练误差很大的现象。
过拟合:如果学得的模型训练误差很小,而泛化能力较弱即泛化误差较大的现象。
模型的容量:
指其拟合合作函数的能力,也称为模型的复杂度。
容量不足的模型不能解决复杂任务,可能出现欠拟合。
容量高的模型能够解决复杂的任务,但是其容量高于任务所需时,有可能会过拟合。
过拟合的原因-误差
最终预测的总误差=偏差²+方差+不可消解的误差
预测误差总的来说可以被拆解出两种主要的子形式:
来源于“偏差”的误差
来源于“方差”的误差
方差(Varianc

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值