机器学习(一):监督学习、损失函数与风险函数、 经验风险最小化与结构风险最小化

本文介绍了机器学习中的监督学习,包括基本概念如输入空间、输出空间和特征空间,以及监督学习的目标——学习模型。文章还讨论了损失函数和风险函数,解释了经验风险最小化和结构风险最小化之间的区别,强调了结构风险最小化在防止过拟合中的作用。
摘要由CSDN通过智能技术生成

统计学习也称为统计机器学习,希尔伯特·西蒙对学习的定义:如果一个系统能过通过执行某个过程改进它的性能,这就是学习。统计学习就是计算机系统通过运用数据及统计方法提高系统性能的机器学习。

统计学习包括监督学习、非监督学习、半监督学习及强化学习

监督学习的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测

基本概念

输入空间、特征空间、输出空间

在监督学习中将输入与输出所有可能取值的集合分别称为输入空间和输出空间,输入和输出空间可以使有限元素的集合,也可以是整个欧式空间,输入空间和输出空间可以是同一个空间,也可以是不同的空间,但通常输出空间远远小于输入空间

每个具体的输入是一个实例,通常由特征向量表示,这时,所有特征向量存在的空间称为特征空间,特征空间的每一维对应于一个特征,有时假设输入空间与特征空间为相同的空间,对他们不予区分;有时假设输入空间与特征空间为不同的空间,将实例从输入空间映射到特征空间,模型实际是都是定义在特征空间上的

根据输入、输出变量类型的不同,对预测任务给予不同的名称:

  • 输入变量与输出变量均为连续变量的预测问题称为回归问题
  • 输出变量为有限个离散变量的预测称为分类问题
  • 输入变量和输出变量均为变量序列的预测问题称为标注问题; 

假设空间

监督学习的目的在于学习一个由输入到输出的映射,这一映射由模型来表示。模型属于由输入空间到输出空间的映射的集合,这个集合就是假设空间

监督学习利用训练数据集学习一个模型,再用模型对测试集进行预测,训练集往往是人工标注给出的,所以称为监督学习,监督学习分为学习和预测两个过程,由学习系统和预测系统完成

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值