《机器学习》笔记：引言

chengyue98

于 2022-03-16 14:52:53 发布

阅读量1.7k

点赞数 1

分类专栏：机器学习文章标签：机器学习算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chengyue98/article/details/123525308

版权

机器学习专栏收录该内容

3 篇文章

订阅专栏

1.1 引言

机器学习致力于研究如何通过计算的手段，利用经验来改善系统自身的性能。主要内容是在计算机上从数据中产生model的算法，及“学习算法”。

1.2 基本术语

基本术语	释义
数据集 $D$	数据记录的集合
样本 $x_i$ （示例）	单独一条记录
属性（特征）	反映事物或对象在某方面的表现或性质的事项
属性值	属性上的取值
属性空间 $X$ （样本空间、输入空间）	属性张成的空间
训练数据（training data）	训练过程中使用的数据
真实/真相（ground truth）	模型需要学习的潜在规律本身

（一）预测模型

若预测的是离散值，则称为“分类”任务；若预测的是连续值，则称为“回归”任务。
若只涉及两个类别的“二分类”任务，其中一个为正类，一个为反类。
若任务具有多个类别，则成为“多分类”任务。

（二）聚类模型

按照一些潜在的概念将样本划分为若干组，每一组称为一个cluster（簇）。

（三）泛化概念

模型适用于新样本的能力，称为“泛化”能力。
通常假设样本空间中全体样本服从一个未知分布，每个样本都是从独立地从这个分布上采样获得的，即“独立同分布”。

1.3 假设空间

假设空间：所有假设组成的空间
版本空间：与训练集一致的“假设集合”

1.4 归纳偏好

若 $\gamma_a$ 为算法 $a$ 在训练集之外的所有样本的误差， $\gamma_b$ 为算法 $b$ 在训练集之外的所有样本的误差，则有：
$\sum_fE_{ote}(\gamma_a|X,f)=\sum_fE_{ote}(\gamma_b|X,f)$

即算法本身并无好坏之分，只有在某一具体问题上的好坏之分。一种算法在某种问题上具有很好的表现，则肯定在其他某种问题上有很差的表现。

1.5 发展历程

1.推理期

2.知识期

1980s：从样例中学习
1990s：统计学习
2000s:深度学习

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。