人工智能学习之路——基本术语

基本术语

  • 数据集:一组记录的集合

  • 记录:关于一个事件或对象的描述,又称“示例/样本”
    如关于一个西瓜的记录:(色泽=浅白;根蒂=硬挺;敲声=清脆) 多个西瓜的记录又可以构成一组西瓜的数据集

  • 属性:反映事件或对象在某方面的表现或性质的事项
    如"色泽",“敲声”

  • 属性空间:属性张成的空间
    如把“色泽”“根蒂”“敲声”作为三个坐标轴,则张成一个用于描述西瓜的三维空间 用于表述西瓜的三维空间,每个西瓜都有对应的坐标 , 空间中每一个点对应一个坐标向量,一个示例也称为“特征向量”
    在这里插入图片描述

  • 学习/训练:从数据中学得模型的过程

  • 训练数据:训练过程中使用的数据

  • 训练样本:其中每一个样本称为“训练样本”

  • 训练集:训练样本组成的集合

  • 假设:指学得的模型,对应于关于数据的某种潜在的规律

  • 真相/真实:潜在规律的本身

  • 学习过程:就是为了找出真相或逼近真相

  • 标记(lable):关于示例的结果,如“好瓜”
    ((色泽=浅白;根蒂=硬挺;敲声=清脆),好瓜)
    一般地:
    在这里插入图片描述

若欲预测的是离散值,“好瓜”“坏瓜”;此类学习任务称为“分类(classification)”;只涉及到两个类别,称为“二分类(binary classification)”
若欲预测的是连续值,西瓜的成熟度0.94,0.37; 此类学习任务称为“回归(regression)”
还可以对西瓜进行“聚类”(clustering)将训练集中的西瓜分为若干组,每组称为一个“簇”(cluster),如浅色瓜,深色瓜
根据训练数据是否拥有标记信息,学习任务可分为:“监督学习”(supervised learning),“无监督学习”(unsupervised learning)
“分类”,“回归”是“监督学习”代表,“聚类”是“无监督学习”代表

  • 测试(testing):学得模型后,使用模型进行预测的过程

  • 测试样本(testing sample):被测试的样本
    在这里插入图片描述
    f:模型; y:标记(lable);x:测试例

  • 泛化:学得的模型适应新样本的能力

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值