这学期,将学习周志华老师的《机器学习》这本书,一周两章,每章我都会做上一点笔记,笔记或多或少,或工整或潦草,一切根据我当时的时间和心情而定,简单的定义或者易理解的知识我可能附上定义甚至不写,不懂的地方会特别强调指出。所以这个学习系列我称为《机器学习》随心记。
整个随心记的每章由两部分组成,一个是我阅读时产生的问题,我会在解决后在博客的评论或者再编辑解答相应问题;另一个就是基础知识定义以及我对个别定义公式的理解。如果有错误,欢迎指正!如果有需要交流的同志,可以联系Q122643224~附上CSDN学习交流。
第一部分
产生的问题:
P8 公式(1.1)的推导?
P8 左下角,附注里,为什么有一般不一致这样一个结论?
第二部分
第一章 绪论
由于学习过统计学习方法,整个第一章对我来说难度不是很大,全章以定义概念居多。
P1
模型:泛指从数据中学得的结果。
P2
数据集:一组记录的集合
样本:数据集中的一条记录是关于一个事件或者一个对象
属性或特征:反应事件或对象在某方面的而表现或性质
属性值:属性上的取值。
属性空间、样本空间、输入空间:属性张成的空间。
特征向量:样本空间的每个点对应一个坐标向量,称为一个样本的特征向量。
训练集:训练样本组成的集合。
标记:示例结果的信息。
样例:拥有了标记信息的示例,称为样例。
P3
标记空间,输出空间,Y是所有标记的集合,称为标记空间。
分类和回归:
测试样本:被预测的样本。
聚类,簇
监督学习和无监督学习:
独立同分布:
P4
归纳和演绎
P5
假设空间:把学习过程看作一个在所有假设组成的空间中进行搜索的过程,搜索的目标是找到与训练集匹配的假设,即能够将训练集中的瓜判断正确的假设。
版本空间:可能有多个假设与训练集一致,即存在一个与训练集一致的假设空间。
P6
归纳偏好:机器学习算法再学习过程中对某种类型假设的偏好
P7
奥卡姆剃刀:若有多个假设与观察一致,则选择最简单的那个
P8
理解式(1.1)
左边即误差之合
右边是先计算非训练集的样本误差之和,再计算和与产生该假设的乘积,每个假设再求和。
(1.1理解有问题,详细解答见第一部分问题)
P9
NFL定理:
P10-P13:发展历程
P13-P18:应用现状