机器学习专业术语

本文介绍了机器学习中的一些基本概念,包括模型、数据集、属性和特征、学习过程、训练与测试、分类与回归任务、监督与无监督学习,以及泛化能力的重要性。
摘要由CSDN通过智能技术生成
  • 模型(model): 计算机层面的认知
  • 学习算法(learning algorithm),从数据中产生模型的方法
  • 数据集(data set): 一组记录的合集
  • 示例(instance): 对于某个对象的描述
  • 样本(sample): 也叫示例
  • 属性(attribute): 对象的某方面表现或特征
  • 特征(feature): 同属性
  • 属性值(attribute value): 属性上的取值
  • 属性空间(attribute space): 属性张成的空间
  • 样本空间/输入空间(samplespace): 同属性空间
  • 特征向量(feature vector): 在属性空间里每个点对应一个坐标向量,把一个示例称作特征向量
  • 维数(dimensionality): 描述样本参数的个数(也就是空间是几维的)
  • 学习(learning)/训练(training): 从数据中学得模型
  • 训练数据(training data): 训练过程中用到的数据
  • 训练样本(training sample):训练用到的每个样本
  • 训练集(training set): 训练样本组成的集合
  • 假设(hypothesis): 学习模型对应了关于数据的某种潜在规则
  • 真相(ground-truth):真正存在的潜在规律
  • 学习器(learner): 模型的另一种叫法,把学习算法在给定数据和参数空间的实例化
  • 预测(prediction): 判断一个东西的属性
  • 标记(label): 关于示例的结果信息,比如我是一个“好人”。
  • 样例(example): 拥有标记的示例
  • 标记空间/输出空间(label space): 所有标记的集合
  • 分类(classification): 预测是离散值,比如把人分为好人和坏人之类的学习任务
  • 回归(regression): 预测值是连续值,比如你的好人程度达到了0.9,0.6之类的
  • 二分类(binary classification): 只涉及两个类别的分类任务
  • 正类(positive class): 二分类里的一个
  • 反类(negative class): 二分类里的另外一个
  • 多分类(multi-class classification): 涉及多个类别的分类
  • 测试(testing): 学习到模型之后对样本进行预测的过程
  • 测试样本(testing sample): 被预测的样本
  • 聚类(clustering): 把训练集中的对象分为若干组
  • 簇(cluster): 每一个组叫簇
  • 监督学习(supervised learning): 典范--分类和回归
  • 无监督学习(unsupervised learning): 典范--聚类
  • 未见示例(unseen instance): “新样本“,没训练过的样本
  • 泛化(generalization)能力: 学得的模型适用于新样本的能力
  • 分布(distribution): 样本空间的全体样本服从的一种规律
  • 独立同分布(independent and identically distributed,简称i,i,d.):获得的每个样本都是独立地从这个分布上采样获得的。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值