第1章 引言
1.1 学习问题的标准描述
机器学习的定义:对于某类任务
T
和性能度量
1.2 设计学习系统
- 选择训练经验
- 属性1:能否为系统的决策提供直接或间接的反馈;间接反馈面临信用分配(credit assignment)问题.
- 属性2:学习器可以在多大程度上控制训练样例序列;包括三种情况:
- 训练经验是超乎学习器控制的随机过程提供的;
- 学习器可向施教者提出不同类型的查询;
- 学习器通过自动探索环境来搜集训练样例。
- 属性3:训练样例的分布能多好地表示实例分布。
- 选择目标函数
- 选择目标函数的表示
- 选择函数逼近算法
- 最终设计
- 执行系统(Performance System):用学会的目标函数来解决给定的任务;
- 鉴定器(Critic):以历史记录为输入,输出目标函数的一系列训练样例;
- 泛化器(Generalizer):以训练样例为输入,产生一个输出假设,作为对目标函数的估计;
- 实验生成器(Experiment Generator):以当前假设为输入,输出一个新的问题供执行系统去探索。
1.3 机器学习的一些观点
机器学习的问题可归结为搜索问题,即对非常大的假设空间进行搜索,以确定最佳拟合观察到的数据和学习器已有知识的假设。