第二章-机器学习基本概念

机器学习基本概念

假设空间

  • 所有模型的集合称为假设空间
  • 与训练集一致的假设集合,我们称为版本空间在这里插入图片描述

学习方法三要素

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

  • 损失函数是模型一次预测的好坏。
  • 风险函数是平均意义上模型预测的好坏。
    在这里插入图片描述
    在这里插入图片描述

训练误差和测试误差

  • 当损失函数是0-1损失时,测试误差+测试准确率=1
    在这里插入图片描述

过拟合和模型选择

给一个例子具体说明过拟合,在经验风险最小时,看W的取值(参数的个数)
在这里插入图片描述
M不同,拟合曲线不同,可以看出M=9时,拟合最好
在这里插入图片描述
下图是训练和测试误差,虽然M=9时,训练误差最小,但是测试误差很大。这就是过拟合现象:学习时选择的模型过于复杂,或者包含的参数太多,以至于这个模型对已知的数据预测的很好,对未知数据预测的很差这一现象。
在这里插入图片描述
训练误差和测试误差与模型复杂度的关系图
在这里插入图片描述
当模型较复杂时,我可以增加训练样本集大小的方式去减少泛化误差。
针对减小泛化误差另外一种方法就是正则化。
在这里插入图片描述
当M=9时,加入正则化项后,模型性能变化。
在这里插入图片描述
正则化项增大,如右边为0,会使参数受到更大的抑制,从而模型变得更加简单。
在这里插入图片描述

泛化能力

模型泛化能力是指,由该方法学习到的模型,对未知数据预测的能力。
主要通过测试误差来评价,但是测试数据的有限和不同,使得评价不是很可靠。
泛化能力是通过研究泛化误差的上届进行的,
在这里插入图片描述
在这里插入图片描述

生成模型和判别模型

监督学习方法分为生成方法和判别方法,对应生成模型和判别模型。
生成模型:模型为决策函数或条件概率分布,由数据学习联合概率分布,然后求出条件概率。
判别模型:直接求取决策函数,或条件概率分布。
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值