《机器学习》周志华—第一章学习总结

最新推荐文章于 2024-10-08 14:42:26 发布

刘阿怪

最新推荐文章于 2024-10-08 14:42:26 发布

阅读量791

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.1基本术语

要进行机器学习，先要有数据。书中就以一批关于西瓜的数据为例，eg:（色泽=浅白；根蒂=硬挺；敲声=清脆），.......每对括号内是一条记录，”=”意思是“取值为”。这组记录的集合称之为一个“数据集”，（有时数据集也称之为“样本”）其中每一条记录是关于一个事件或对象（这里是一个西瓜）的描述，称之为是一个“示例”或“样本”。反应事件或对象在某方面的表现或性质的事项，“色泽”“根蒂”“敲声”称为“属性”或“特征”，属性上的取值称为“属性值”，属性张成的空间称为“属性空间”，“样本空间”，“输入空间”。例如我们把“色泽”“根蒂”“敲声”作为三个坐标轴，则它们张成一个用于描述西瓜的三维空间，每个西瓜都能在这个空间中找到自己的位置，由于空间中的每个点对应一个坐标向量，因此也把一个示例称之为“特征向量”。
一般地，令D={x1,x2,x3.........,xm}表示包含m个示例的数据集，每个示例由d个属性描述（例如上面的西瓜数据使用了3个属性），d称之为样本xi的维数（xi是d维样本空间X的一个向量）
从数据中得到的模型的过程称之为“学习”或“训练”，这个过程依靠执行某个学习算法实现。训练过程中使用的数据称为“训练数据”，其中每个样本称为“训练样本”，训练样本组成的集合称为“训练集”。学得模型对应了关于数据的某种潜在的规律，因此亦成“假设”。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。