1 课程讲师
Tengyu Ma and Chris Re
马腾宇的领英工作经历介绍:https://www.linkedin.com/in/tengyuma/
2 课程先修知识
概率论:分布,随机变量,期望,条件概率、方差、密度
线性代数:矩阵乘法、特征向量
基本编程:Python
3 机器学习的定义
Arthur Samuel(1959):机器学习是一门研究领域,它使计算机无需明确编程即可学习。
Tom Mitchell(1998):如果计算机程序在t任务中的性能(用p衡量)随着经验e的提高而提高,那么它就可以从经验e中学习某些任务t和性能度量p。
4 机器学习的分类
4.1 监督学习
4.2 无监督学习
无监督学习:现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。
4.3 强化学习
强化学习:是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。