Day 1
机器学习所关注的问题是:计算机如何根据经验的累加提升自己的性能?
1.1学习问题的描述:
定义: 对于某类任务 T 和性能度量 P,如果一个计算机程序在 T 上以 P 衡量的性能随着经验 E 而自我完善,那么我们称这个计算机程序在从经验 E 学习。
定义一个学习问题:
任务的种类,衡量任务提升的标准,检验的来源。
1.2设计一个学习系统
选取训练经验的类别:训练经验是否能给训练决策提供直接或者间接的反馈。(信用配分:考虑每一次走子对最终的结果的贡献程度。但由于其期间变量太多,不准确。所以一般考虑直接训练反馈。)
学习器可以在多大程度上控制训练样例序列:训练经验是以超乎学习器控制的随机过程提供的;学习器可向施教者提出不同类型的查询;以及学习器通过自动探索环境来搜集训练样例。这些主要是将学习器与施教者之间的相互关系。