智能觉醒:传感—运动体验引领 AI 进化之路

在人工智能七十余年的发展历程中,一条清晰的发展脉络逐渐浮现出来:从最初那种纯粹依赖抽象推理的“无感”系统,到如今依靠传感器数据进行自主学习和预测的智能体,体验(experience)一直在扮演着至关重要的角色。Rich Sutton 在其专题论文中强调了传感—运动体验在 AI 中逐步积淀和变革的四大关键步骤:一是“智能体”的诞生,即拥有感知和行动的基本能力;二是通过“奖励”机制引入目标追求;三是构建“体验状态”,以历时行为形成状态表示;四是发展“预测知识”,以预知未来为目的。本文将深入探讨这一脉络和其背后的理论,为读者揭示传感—运动体验如何驱动现代 AI 向着更好地理解和掌控世界迈进。


🤖 一、从“无感”系统到“智能体”——体验的原点

在 AI 的早期时代(1954~1985),大多数系统被设计为解决高级形式问题,如符号计算、逻辑推理以及形式验证任务。那个时期的 AI 主要依赖于固定的规则和逻辑语句,比如经典的积木世界 (blocks world) 问题。下面是一个典型的积木世界规划问题示例:

Init: On(A, Table) ∧ On(B, Table) ∧ On(C, A) ∧ Block(A) ∧ Block(B) ∧ Block(C) ∧ Clear(B) ∧ Clear(C)
Goal: On(A, B) ∧ On(B, C)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

步子哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值