机器学习基本概念及基础知识_1

样本:关于一个事件或一个对象的描述的记录称为一个样本或一个示例
数据集:样本的集合称为一个数据集
学习:从数据中学得模型的过程称为学习或者训练。训练过程中使用的数据称为训练数据。其中每个样本称为训练样本。训练样本组成的集合成为你训练集。
示例结果的信息称为标记。拥有标记信息的示例称为样例。所有标记的集合称为“标记空间”或“输出空间”
二。
若我们预测的是离散值,例如“好西瓜”或“坏西瓜”。此类学习任务称为“分类”
若预测的结果是连续值,则称此类的学习任务为“回归”
将聚类中的数据分为若干个组,每个组称为一“簇”。将这种方法称为聚类。
三。
根据训练集中是否拥有标记信息。学习任务可大致划分为“有监督学习”和“无监督学习”。分类学习和回归学习是前者的代表。聚类是后者的代表。
学得模型适用于新样本的能力称为“泛化”能力。具有强泛化能力的样本能很好地适用于整个样本空间。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值