在开始西瓜书系列之前,首先声明一下:作者并不是一个专业的程序员,只是跨界而来,想看看所谓的机器学习究竟是一片怎样的风景。一千个人眼中有一千个哈姆雷特。同样的,面对同一本书,每个人的理解是不同的。在这个读西瓜书的系列笔记中,我仅以自己所熟悉的那些知识和背景出发,来记录自己的读书历程。
1. 什么是机器学习。
大段的标准化的定义我们就免去了。就我的理解而言,先是有了一个T-Task,接着我们得到了E-Experience,然后通过计算机去获得并改善P-Performance. 缺一不可。先提出一个要解决的问题,通过学习获取经验,不断的衡量成绩,这和我们人类的学习有很多相同的地方。
2. 基本术语
作者在这部分用挑西瓜的例子,给大家介绍了一些基本的术语。大致整理了一下:
数据集(Data Set),样本(Sample),特征(Feature),看图就很清楚了
标记(Label),分类问题(Classification),回归(Regression)
关于模型的泛化、特化,以及归纳偏好