机器学习——基本术语

本文详细介绍了机器学习的基本术语,包括机器学习的定义、目标、样本、属性空间、模型、学习过程、训练集、测试、泛化能力、假设、概念学习和归纳偏好等。强调了泛化能力和模型适用新样本的重要性,同时探讨了机器学习与数据挖掘、数据库技术的紧密联系。
摘要由CSDN通过智能技术生成

第一章  基本术语

1、机器学习的定义:从数据中自动的归纳逻辑或规则,并根据这个归纳的结果与新数据来进行预测的算法。要讨论算法的相对优劣,必须要针对具体的学习问题。

2、目标:使得学得的模型能很好的适用于“新样本”,而不仅仅在训练样本上工作得很好,即便是对聚类这样的无监督学习,也希望学得的聚划分能适用于没在训练集中出现的样本。

3、样本(示例、特征向量): 数据集中的每个记录称之为样本或者示例。 

4、属性空间(样本空间、输入空间):样本属性张成的空间称为属性空间(样本空间、输入空间),每个样本对应空间中的一个点,故而一个示例也称为一个“特征向量”。

5、模型:模型也称为学习器,可看作学习算法在给定数据集和参数空间的实例化。

6、学习:从数据中学得模型的过程称为“学习”或“训练”,这个过程通过执行某个学习算法来完成。

7、训练集:训练过程中使用的数据称为训练数据,训练样本组成的集合称为训练集。学得的模型对应了关于数据的某种潜在的规律,因此称为“假设”。这种潜在规律自身,则是称为真相或真实,学习过程就是为了找出或逼近真相。训练集通常是样本空间中很小的一个采样。

8、测试:学得模型后,使用其进行预测的过程称为“测试”,被测试的样本称为测试样本。

 监督学习与无监督学习:根据训练数据是否拥有标记信息,学习任务可以分为两类,监督学习和无监督学习:分类和回归是前者的代表,聚类是后者的代表(学习过程中使用的训练样本通常不拥有标记

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值