机器学习之西瓜书绪论--关于机器学习的简单介绍

无你想你

已于 2022-10-11 20:41:05 修改

阅读量467

点赞数

分类专栏：机器学习西瓜书文章标签：机器学习人工智能算法

于 2022-10-11 20:35:53 首次发布

本文链接：https://blog.csdn.net/qq_62904883/article/details/127266490

版权

机器学习西瓜书专栏收录该内容

6 篇文章 0 订阅

订阅专栏

机器学习的简单介绍

绪论
1.1机器学习是能够用来干嘛的
参考链接

绪论

1.1机器学习是能够用来干嘛的

我们在辨别一个西瓜的好坏的时候,我们都是通过其色泽,敲声等方便对其进行一个判断是否为一个好瓜,机器学习就是希望将人类所感知到的经验来实现并完成一定的目的,其致力于研究通过计算的手段来改善系统自身的性能,"经验"往往通过数据的方式存在,也就是说,机器学习是通过数据当中产生的模型的算法

1.2 机器学习的基本术语

简单介绍一些经常用到的基本术语,但是在学习的时候也会慢慢引入

名称	英文名称
数据集	$d a t a se t$
样本	$s am pl e$
样本空间	$\ space$
维数	$d im e n s i o na l i t y$
特征空间	$\ vector$
学习	$l e a r nin g$
训练	$t r ainin g$
训练数据	$\ data$
测试样本	$testing\ sample$
假设	$h y p o t h es i s$
分类	$c l a ss i f i c a t i o n$
回归	$re g ress i o n$
监督学习	$\ learning$
非监督学习	$\ learing$

就先简单介绍一下部分专用的术语,这方面到时候大家学习的时候,遇到了再记也是没问题的

1.3 假设空间

归纳和演绎是科学推理的两大基本手段
对于判断一个西瓜是否为好瓜,其方法是多种多样的,那么我们可以把对好瓜的判断学习过程看作是一个再所有假设( $h y p o t h es i s$ )组成的空间进行搜索的过程,假设空间的方法有很多,例如自顶向下,从一般到特殊,从特殊到一般,最终获得的结果应当与训练集保持一致(图片表示的就是决策树这一种算法,其思想判断方法就是一种假设空间的方法)
在这里插入图片描述

1.4归纳偏好

如果每一个空间假设在训练过程中都尽可能的实现了对数据的较高的训练,但是问题就在于如果遇到了新的数据集当中,可能会因为过于注重训练精度而导致训练精度过高,造成了其在预测上面的精度并不高(也就是俗称的过拟合)
还有就是因为偏好的问题,可以理解为,一个好的西瓜可能并不能满足其色泽,根蒂,敲声都是完完全全符合要求的,往往可能只需要满足其中一种,就可以判断其是好瓜,对于这种类型假设的偏好,称为 “归纳偏好”
归纳偏好可以看作是学习算法自身在一个很庞大的假设空间中对假设进行选择的启发式或价值观,也就是什么样的模型更好