在人工智能七十余年的发展历程中,一条清晰的发展脉络逐渐浮现出来:从最初那种纯粹依赖抽象推理的“无感”系统,到如今依靠传感器数据进行自主学习和预测的智能体,体验(experience)一直在扮演着至关重要的角色。Rich Sutton 在其专题论文中强调了传感—运动体验在 AI 中逐步积淀和变革的四大关键步骤:一是“智能体”的诞生,即拥有感知和行动的基本能力;二是通过“奖励”机制引入目标追求;三是构建“体验状态”,以历时行为形成状态表示;四是发展“预测知识”,以预知未来为目的。本文将深入探讨这一脉络和其背后的理论,为读者揭示传感—运动体验如何驱动现代 AI 向着更好地理解和掌控世界迈进。
🤖 一、从“无感”系统到“智能体”——体验的原点
在 AI 的早期时代(1954~1985),大多数系统被设计为解决高级形式问题,如符号计算、逻辑推理以及形式验证任务。那个时期的 AI 主要依赖于固定的规则和逻辑语句,比如经典的积木世界 (blocks world) 问题。下面是一个典型的积木世界规划问题示例:
Init: On(A, Table) ∧ On(B, Table) ∧ On(C, A) ∧ Block(A) ∧ Block(B) ∧ Block(C) ∧ Clear(B) ∧ Clear(C)
Goal: On(A, B) ∧ On(B, C)