吃瓜（西瓜书-南瓜书）1、2章

最新推荐文章于 2024-07-25 10:27:09 发布

shinel`l

最新推荐文章于 2024-07-25 10:27:09 发布

阅读量665

点赞数

分类专栏：机器学习西瓜书南瓜书文章标签：人工智能机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44898314/article/details/126376160

版权

机器学习同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

西瓜书南瓜书

1 篇文章 0 订阅

订阅专栏

一.绪论

机器学习是一门致力于研究如何通过计算手段，利用经验来改善自身性能的学科。

1.1 基本术语

要进行机器学习，首先得有数据；数据集合组成数据集，其是关于一个事件或对象的描述；反映事物在某方面的表现或性质的事项称为属性，属性取值称为属性值，属性张成的空间称为属性空间or样本空间。

从数据中学得模型的过程称为“学习”or“训练”，训练数据中的每个样本称为训练样本，样本组成的集合称为训练集；学习模型对应了关于数据的某种潜在规律，称为假设。

学得模型后使用其进行预测的过程称为“测试”，被预测的样本称为测试样本。

1.2假设空间

可以把学习过程看作一个在所有假设组成的空间力进行搜索的过程，搜索目标是找到与训练集“匹配”的假设，假设的表示一旦确定，假设的空间和规模大小就确定了；有许多策略对假设空间进行搜索，例如自顶向下、一般到特殊等等，搜索过程中可以不断删除与正例不一致的假设，最终会获得与训练集一致的假设。

1.3归纳偏好

归纳偏好对应了学习算法本身所做出的关于“什么样的模型更好”的假设，算法的归纳偏好是否与问题本身匹配，大多数时候直接决定了算法能否取得好的性能。

1.4了解

包含关系：人工智能>机器学习>深度学习（神经网络类算法）

人工智能应用领域：计算机视觉CV、自然语言处理NLP、推荐系统RS等。

二模型选择与评估

2.1经验误差与过拟合

一般的，我们把学习器的实际预测输出与样本的真实输出之间的差异称为误差，学习器在训练集上的误差称为经验误差；

当学习器把训练样本学得太好，可能已经把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质，这样会导致泛化性能下降，该现象称为过拟合。

……待补充。

2.2评估方法

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吃瓜（西瓜书-南瓜书）1、2章

可以把学习过程看作一个在所有假设组成的空间力进行搜索的过程，搜索目标是找到与训练集“匹配”的假设，假设的表示一旦确定，假设的空间和规模大小就确定了；从数据中学得模型的过程称为“学习”or“训练”，训练数据中的每个样本称为训练样本，样本组成的集合称为训练集；归纳偏好对应了学习算法本身所做出的关于“什么样的模型更好”的假设，算法的归纳偏好是否与问题本身匹配，大多数时候直接决定了算法能否取得好的性能。一般的，我们把学习器的实际预测输出与样本的真实输出之间的差异称为误差，学习器在训练集上的误差称为经验误差；...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。