周志华西瓜书笔记——第一章

最新推荐文章于 2024-06-20 02:12:52 发布

HannanKan

最新推荐文章于 2024-06-20 02:12:52 发布

阅读量1.9k

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LOVE_CODE_LOVE_LIFE/article/details/73550759

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.1引言

概念1：基于经验做出的预判

机器学习定义：通过计算手段，利用经验数据产生模型用于改善系统自身性能。

更形式化的定义：假设用P 来评估计算机在某任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能上的改善，就说关于T,P，该程序对E进行了学习。

1.2基本术语

Data set 数据集：纪录的集合

Instance、sample 示例、样本：某条具体的纪录

attribute、feature 特征、属性

Attribute value 属性值

Attribute space、sample space 属性空间、样本空间

Feature vector 特征向量：in the attribute space，every instancecorresponding to a vector

示例：数据集 D={X1,X2,X3,,,Xm}由m个示例组成，

Xi=(xi1,xi2,,,xid),每个示例由d个属性描述 Xi是d维样本空间的一个向量，d称为Xi的维数

Label 标记

Example 样例：拥有了标记信息的示例

Label space 标记空间：所有标记的集合

一个样例：(Xi,Yi)

学习的任务分类：

1. 预测离散值——classification 分类

binary classification 二分分类，positive class 正类，negative class 反类

multi-class classification 多分类

2. 预测连续值——regression 回归

学习结果：

建立一个从输入空间到输入空间的映射f

聚类：训练集中的样本称为一个簇，这些簇对应一些潜在的分类

Supervised learning 监督学习：训练数据拥有标记信息，分类和回归是这类学习的代表

Unsupervised learning 无监督学习：不用有标记信息，聚类是这类学习的代表

Generalization 泛化能力：学习得到的模型适用于新样本的能力

通常假设整个样本空间遵从一个未知的分布 D

Independent and identical distributed 独立同分布 i.i.d: 在概率统计中，指随机过程中，任何时刻取值都为随机变量，如果这些随机变量遵从同一分布，并且相互独立，那么这些随机变量是独立同分布

1.3 假设空间

假设是所有可能结果的集合

学习过程是在所有假设组成的空间中寻找符合训练集的假设的过程

版本空间：多个与训练集相匹配的假设所组成的集合

1.4 归纳偏好：

机器学习算法在学习过程中对某类型假设的偏好，称为归纳偏好

选择归纳偏好的原则有：

奥卡姆剃刀原则——当有多个假设符合观察的时候，选择最简单的那个

没有免费的午餐定理 NFL定理，任何两个算法的期望值都是相等的——重要前提：所有问题出现的机会相同，重要性相同——启发：针对具体的问题选择归纳偏好，因为对于所有潜在的可能性，任何算法期望是相等的这样的假设对解决具体问题是没有意义的

1.5机器学习发展历程：

推理期：赋予机器逻辑推理能力

知识期：使得机器拥有知识

1.6机器学习的应用

1.7 阅读材料：推荐各种阅读材料+重要国际、区域性会议+期刊

习题解答：

注意点，版本空间的每一假设都能单独地符合（退出）给定的示例
解题思路，先列出假设空间，根据给定的训练数据进行筛选。

后面习题有些难，附上链接 http://blog.csdn.net/icefire_tyh/article/details/52064910

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
周志华西瓜书笔记——第一章

1.1引言概念1：基于经验做出的预判机器学习定义：通过计算手段，利用经验数据产生模型用于改善系统自身性能。更形式化的定义：假设用P 来评估计算机在某任务类T上的性能，若一个程序通过利用经验E在T中任务上获得了性能上的改善，就说关于T,P，该程序对E进行了学习。 1.2基本术语Data set数据集：纪录的集合Instance、sample示例、样本：某
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。