机器学习读书笔记1

本文介绍了机器学习的基本术语,包括数据集、样本空间、属性、特征、标记和输出空间,以及监督与无监督学习的区别。此外,详细讨论了假设空间的概念,指出模型训练的目标是找到与训练集一致的假设集合,强调了泛化能力的重要性。
摘要由CSDN通过智能技术生成

机器学习读书笔记1

1绪论

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

1.1基本术语

数据集是一组记录的集合X,每一个记录是对于一个对象的描述。
对于每一个样本xi,我们描述其d个属性(特征),于是产生了一个d维样本空间,同时每一个样本对应一个d维向量。
除了d个属性(特征),每一个对象还需要一个标记label(yi),即对象的分类类别。yi的集合Y是所以可能的类别,称为输出空间。
Y中是离散值,对应“分类”任务;Y中是连续值,对应“回归”任务。
通过数据学习得到模型的过程称为训练,结果是一个由输入集X到输出空间Y的映射。

监督学习:训练集有标记信息label,如分类和回归;
无监督学习:训练集无标记信息,如聚类。
学习得的模型适用于新样本的能力称为“泛化”能力。

1.2假设空间

样本每种属性可能的取值组合构成的集合,有(num1+1)(num2+1)……*(numd+1)+1个假设。
训练的结果就是找出和训练集一致的“假设集合”(假设空间的子集)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值