导读:学习究竟是什么?简单来说,学习是在外部刺激下记住大部分以往的经验,从而能够实现改变的能力。因此,机器学习是一种工程方法,对于增加或提高自适应变化的各项技术都十分重要。例如,机械手表是一种非凡的工件,但其结构符合静止定律,当外部变化发生变化时会变得没有任何用处。
学习能力是动物特别是人特有的,根据达尔文的理论,它也是所有物种生存和进化的关键要素。机器虽然不能自主进化,但似乎也遵循同样的规律。
▲自适应系统的示意图
Adaptive System: 适应系统
Parameter tuner/ trainer: 参数调整/训练器
Input elements: 输入元素
Feedback: 反馈
Output elements: 输出元素
Enviornment: 环境
机器学习的主要目标是学习、策划和改进数学模型,该数学模型可以使用由环境提供的相关数据进行一次或连续多次的训练得到,利用该数学模型推断未来并做出决定而不需要所有影响因素(外部因素)的全部知识。
换句话说,agent(从环境中接收信息的软件实体,选择达到特定目标的最佳行动并观察其结果)采用统计学习方法,通过确定正确的概率分布,来预测最有可能成功(具有最小错误)的动作(值或决策)。
我更喜欢使用术语推断而不是预测,只是为了避免把机器学习看成是一种现代魔法(这种看法但并不罕见)。此外,可以引入一个基本的声明:一个算法只有在影响实际数据时,才能推断出一般的规律,并以相对较高的精度来学习算法的结构。虽然术语预测可以自由使用,但其具有与物理学或系统理论相同的含义。在复杂场景下,例如使用卷积神经网络的图像分类问题,即使信息(几何,颜色,特征,对比度等)已经存在于数据中,模型也必须足够灵活以便提炼和永久学习。
01 监督学习
监督学习中有教师或监督者的概念,其主要功能是提供误差的精确度量(直接与输出值相比)。在实际算法中,该功能由多组对应值(输入和期望输出)