什么是机器学习?
[Mitchell,1997]:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。
全文第1章绪论部分重点介绍了机器学习中的【1】基本术语;【2】假设空间;【3】归纳偏好;【4】发展历程与现状
【1】基本术语
以一批西瓜为例(估计这就是西瓜书的由来):
(色泽 = 青绿;根蒂 = 蜷缩;敲声 = 浊响),
(色泽 = 乌黑;根蒂 = 稍蜷;敲声 = 沉闷),
(色泽 = 浅白;根蒂 = 硬挺;敲声 = 清脆)。
根据上述数据为例,我们有如下概念:
数据集(data set):这组数据的集合
示例/样本(instance/sample):数据集中,每条记录是关于一个事件或对象(这里是一个西瓜)的描述
属性/特征(attribute/feature):反映事件或对象在某方面的表现或性质的事项,例如色泽、根蒂、敲声
属性值(attribute value):属性上的取值
<