01机器学习绪论

添加链接描述

1.什么是机器学习

机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能。 ——周志华

在计算机系统中,经验通常以数据的形式存在,因此机器学习所研究的主要内容,是关于在计算机上从数据中产生模型的算法,即学习算法。

模型即泛指从数据中学得的结果。

机器学习=数据+模型+算法

2.基本术语

数据集:数据的集合。每一条单独的数据称为样本或实例。对于每个样本,它通常具有一些属性或特征。属性和样本所张成的空间称为样本空间。

每条记录是一个单独的数据,关于一个事件或对象的描述
称为示例或样本;反映事件或对象在某方面的表现或性质的事项,称为属性或特征;属性上的取值称为属性值;属性张成的空间称为属性空间样本空间或输入空间。
属性张成三维空间 空间中的每个点对应一个坐标向量,一个示例称为一个特征向量

一般的,令D={x_1,x_2,⋯,x_m}表示包含m个样本的数据集,每个样本由d个属性,则每个样本x_i=(x_i1,x_i2,⋯,x_id),其中x_ij是x_i在第j个属性上的取值,d称为样本x_i的维数。

D:数据集/样本集合
m:示例/样本
d:每个样本的所有的属性
在每个样本属性张成的空间坐标中的取值为属性值

从数据中学得模型的过程称为“学习”或“训练”,这个过程通过执行某个学习算法来完成。训练过程中使用的数据称为“训练数据”,其中每个样本称为一个“训练样本”,训练样本组成的集合称为“训练集”。

要建立关于预测的模型,需要获得训练样本的结果信息
示例结果的信息成为标记。
拥有了标记信息的示例称为样例

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值