【一起来啃西瓜书】——绪论

Mr_Nobody17

于 2021-12-30 19:05:55 发布

阅读量880

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Mr_Nobody17/article/details/122243511

版权

机器学习专栏收录该内容

5 篇文章 2 订阅

订阅专栏

目录

1.基本术语

假如我们收集了一批关于西瓜的数据，例如（色泽=青绿；根蒂=蜷缩；敲声=浊响），（色泽=乌黑；根蒂=稍蜷；敲声=沉闷），（色泽=浅白；根蒂=硬挺；敲声=清脆），......

（1）数据集：这组记录的集合称为一个数据集

（2）示例/样本：一个西瓜的描述

（3）属性/特征：例如“色泽”，“根蒂”，“敲声”

（4）属性值：例如“青绿”，“乌黑”

（5）特征向量：[“色泽”，“根蒂”，“敲声”]

（6）分类：预测的是离散值，例如“好瓜”，“坏瓜”

（7）回归：预测的是连续值，例如西瓜成熟度0.95、0.37

（8）聚类：将训练集中的西瓜分成若干组，每组称为一个“簇”，学习过程中没有标记

（9）监督学习：样本有标记，如分类和回归

（10）无监督学习：样本无标记，如聚类

（11）泛化能力：学习出的模型适用于新样本的能力

2.假设空间

（1）归纳：从具体事实归结出一般性规律

（2）演绎：从基础原理推演出具体状况

（3）假设空间：把学习过程看作一个在所有假设组成的空间中进行搜索的过程，搜索目标是找到与训练集“匹配”的假设，即能将训练集中的瓜判断正确的假设。西瓜问题假设空间：

（4）版本空间：存在多个与训练集一致的“假设集合”。

3.归纳偏好

根据上述西瓜版本空间中存在3个与训练集一致的假设。

但3个模型在面临新样本时，却会产生不同的输出，这个时候应该采用哪一种模型？

归纳偏好：机器学习算法在学习过程中对某种类型假设的偏好。

没有免费的午餐：所有机器学习算法的期望性可能跟随机乱猜差不多。

我们只关注自己正在试图解决的问题，希望为它找到一个解决方案，至于这个方案在别的问题、甚至在相似的问题上是否为好方案，我们并不关心。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【一起来啃西瓜书】——绪论

一起来啃西瓜书
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。