机器学习笔记DAY1

本文介绍了机器学习的基础术语,包括学习任务的分类、聚类学习、监督学习与无监督学习的区别,强调了泛化能力的重要性。同时,探讨了过拟合、误差评估方法如留出法、交叉验证和自助法,以及性能度量如均方误差、错误率、精度、查准率、查全率和F1度量。最后,讨论了代价敏感错误率和泛化误差的分解。
摘要由CSDN通过智能技术生成

一些基础术语

  1. 从数据中学得模型的过程称为学习训练,这个过程通过执行某个学习算法来完成,训练过程中使用的数据称为训练数据,其中每个样本成为训练样本,训练样本组成的集合称为训练集

  2. 如果预测的是离散值,此类学习任务称为分类,如果我们预测的是连续值,此类学习任务称为回归

  3. 对西瓜做聚类将训练集中的西瓜分成若干组,每组称为一个簇,这些自动形成的簇可能对应一些潜在的概念划分。在聚类学习过程中,具体能划分哪些簇是我们事先不知道的,而却训练样本中通常不拥有标记信息。

  4. 根据训练数据是否拥有标记信息,学习任务可大致分为两大类:监督学习无监督学习,分类和回归是前者的代表,而聚类则是后者的代表。

  5. 学得模型适用于新样本的能力,称为泛化能力。

  6. “从样例中学习”,被称为归纳学习,要求从训练数据中学得概念,因此也被称为概念学习概念形成

    举个例子,现在有一批训练数据集,有三个维度,色泽,根蒂,敲声,来判断是否是一个“好瓜”的概念。于是我们学得的将是**“好瓜是某种色泽、某种根蒂、某种敲声的瓜”**,在这里&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值