【机器学习】专业名词解释 202107090086

  1. 数据:
    • 在机器学习中,数据是指机器学习算法的输入和输出。
    • 数据可以是各种类型的信息,如文本、图像、音频、视频、传感器数据等。
    • 数据在机器学习中扮演着非常重要的角色,因为它是训练模型和进行预测的基础。
  2. 数据集:
    • 数据集指的是用于训练和评估机器学习模型的数据集合。
    • 数据集由一组样本组成,每个样本包含一个或多个特征和一个或多个标签(也称为目标变量)。
    • 数据集分为训练集、验证集和测试集。
  3. 训练集:
    • 训练集是用于训练机器学习模型的数据集合。
    • 训练集的作用在于通过对样本数据的学习,来构建一个能够对未知数据进行预测、分类或推断的模型。
    • 训练集通常占据数据集的大部分。
  4. 测试集:
    • 测试集用于检验最终选择最优的模型的性能如何。
    • 在机器学习和模式识别等领域中,测试集与训练集和验证集一起,将样本分成独立的三部分。
    • 测试集不能用于模型训练或调整,以避免对模型评估的偏差。
  5. 验证集:
    • 验证集用于确定网络结构或者控制模型复杂程度的参数。
    • 它对训练集构建的机器学习模型进行无偏差估计,确保评估的最优模型是可靠的。
  6. 样本/示例:
    • 样本是用于算法学习或算法评估的数据或数据实例。
    • 例如,在垃圾电子邮件分类中,样本是用来让算法学习和测试的电子邮件集合。
  7. 属性:
    • 属性是描述事物在某个方面的具体表现,又称特征。
    • 在数据中的表现形式为数据集的某一列,一个特征表示一列数据。
  8. 属性空间:
    • 属性空间是属性的所有可能取值组成的集合。
    • 如果属性是多维度的,则属性空间是多维度的集合。
  9. 特征向量:
    • 特征向量是与样本关联的一组属性,通常用向量表示。
    • 例如,在鸢尾花分类问题中,萼片长度、萼片宽度、花瓣长度、花瓣宽度就是特征,它们组成了一个特征向量。
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值