第一章绪论
1引言
1.1问题
(1)通过计算的手段,利用经验来改善系统自身的性能
(2)有了数据
(3)通过某种学习算法
(4)得到模型
(5)进行预测
2基本术语
2.1有了数据
(1)数据集
100个西瓜
(2)样本
1个西瓜
(3)特征向量
1、样本空间
2、颜色、大小、敲起来的振幅
3、维度
(4)属性
颜色
2.2通过某种学习方法
(1)学习
(2)训练
2.3得到模型
(1)有监督学习
1、分类
(1)二分类
1、Y正负
2、瓜农眼中:这个瓜该不该摘,这个瓜熟没熟,我要不要摘
(2)多分类
1、Y大于2
2、市场上要买那种瓜:黑美人、小地雷、特小凤
2、回归
(1)Y=R实数集
(2)某段时间内西瓜的价格,啥时候买西瓜最合适
(2)无监督学习
1、聚类
(1)我们不知道要分几类、机器自己分
(2)每个组称为”簇“cluster
2.4进行预测
(1)测试
(2)测试样本
(3)泛化能力
3假设空间
3.1科学推理手段
(1)归纳:特殊到一般
狭义:从训练数据中得到概念
1、布尔概念:是或不是
2、假设就是各种情况啊,说这么多广义:从样本中学习
(2)演绎:一般到特殊
4归纳偏好
(1)同一个数据集训练出了不同的模型
(2)原则:奥卡姆剃刀
(3)选最简单的那个,也有其他的理解