- 工具:
Matlab
Octave(开源)
- Definition
- Arthur Samuel (1959):
- Field of study that gives computers the ability to learn without being explicitly programmed. (不直接编程)
- Arthur Samuel (1959):
- Tom Mitchell (1998):
- Well-posed learning problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. (学习了经验E之后程序在问题T上的性能有所提高,性能由P来衡量)
- Tom Mitchell (1998):
- 课程分块
- Supervised learning 监督学习
提供了标准答案用于学习。要求:面对新的输入,给予一个输出。
- regression(回归) 连续的问题
例如:提供当地一些房子的面积和房价。现在输入一个房子面积,要求给出一个合适的报价。
- classification(分类) 离散的问题
例如:
提供一些医疗数据,包含了肿瘤患者的年龄,性别,肿瘤的面积,肿瘤的性质(恶性或者良性)。现在输入一个人的性别,肿瘤的面积,要求判断肿瘤的性质(恶性或者良性)
- Learning theory
- Unsupervised learning 无监督学习
没有标准答案,只有数据,让算法找出数据本身的结构。
- clustering(聚类)
- Reinforcement learning 强化学习
不是作出一个决策,而是一系列决策。并不要求每个决策都是正确的,只要大部分决策正确就ok。核心:回报函数 reward function
根据reward function的值来定义一个behavior的好坏。