【机器学习随笔】术语的简单理解

数据集:一组记录的集合,每条记录是关于一个事件或对象的描述,称为“样本”。
属性,特征:反映事件或对象在某方面的表现或性质的
属性控件,样本空间,输入控件:属性张成的空间–(属性组成的坐标轴)
特征向量:空间中的一点
训练数据:训练过程中使用的数据,其中每个样本称为训练样本
训练集:训练样本组成的集合
假设:学得模型对应了关于数据的某种潜在规律
而潜在规律本身,则称为“真相”或“真实”,学习过程就是为了找出或逼近真相。
标记:示例结果的信息
用(Xi,Yi)表示第i个样例,其中Y是所有标记的集合,称为“标记空间”或“输出空间
分类:我们欲预测的是离散值,二分类,一个正类一个反类;多分类
回归:我们欲预测的是连续值
测试:学得模型后,使用其进行预测的过程,被预测的样本称为“测试样本”
聚类:将训练集中的数据分成若干组,每组称为一个“簇”
聚类学习中,各种分簇的概念事先不知道
根据训练数据是否有标记信息学习任务分为监督学习”和“无监督学习”,分类和回归属于前者,聚类属于后者。
泛化能力:学得模型适用于新样本的能力。
拟合和回归:拟合的概念更广泛,拟合包含回归,还包含插值和逼近。拟合是一种数据处理的方式,不特指哪种方法.简单的说就是你有一组数据,觉得这组数据和一个已知的函数(这个函数的参数未定)很相似,为了得到最能表示这组数据特征的这个函数,通过拟合这种方式(具体的数学方法很多)求得参数.而回归是一种特定的数学方法,它可以实现数据拟合,得到函数的参数.也有些拟合得到的参数并非是函数的参数,如神经网络,得到的是这个神经网络的参数。

代价:简单理解代价就是预测值和实际值之间的差距,那对于多个样本来说,就是差距之和。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值