机器学习（暴啃西瓜书-1.导言）

最新推荐文章于 2024-09-17 23:06:28 发布

han_gaga

最新推荐文章于 2024-09-17 23:06:28 发布

阅读量74

点赞数

分类专栏：西瓜书文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31523621/article/details/120605887

版权

西瓜书专栏收录该内容

2 篇文章 0 订阅

订阅专栏

写在前面：

笔者本硕物理背景，以一个非科班的视角阅读西瓜书，多少会有些口语化，欢迎大家交流讨论。本文按照西瓜书的行文逻辑，夹杂自己调研阅读的结果，谈谈自己对书中知识的理解看法，若有不当之处，欢迎指正。

导言：

机器学习，就是希望通过已有经验，来训练出一个模型（学习器），用于判断新的情况。这其中最关键的就是产生模型的算法，即‘学习算法’。

对于监督学习而言，模型就是输入到输出的一种映射。

重要概念：

书中提到了很多术语的概念和定义，这里强调几个容易混淆的：

特征向量：一个样本的各个不同属性（特征）的属性值所组成的一维向量。对应特征空间中的一个点。

样本空间（输入空间）：所有训练样本的特征向量所组成的空间。

标记空间（输出空间）：所有训练样本的标记（y值）所组成的空间。

假设空间：所有可能的输入空间到输出空间的映射的集合。其元素即为模型，称为一个‘假设’。

版本空间：所有与已知数据集一致的假设组成的集合。是假设空间的子集。

归纳偏好：引出-版本空间元素不唯一，多个假设符合训练集，选择哪一个？定义-学习过程中对某种类型假设的偏好，亦简称为：偏好（如最大化信息熵）。根据‘奥卡姆剃刀’原则，一般偏好最简单的那个假设。

发展历史：

(1950s) 推理期——(1975s) 知识期——(1980s) 从样例中学习-决策树（最小化信息熵）—基于神经网络的连接主义学习(仅线性)——(1986)BP算法——(1990s)统计学习方法，SVM+核方法——(2000s)多层神经网络，门槛低。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。