本书四章内容:
介绍,连续空间运动规划3-8章,不确定性的规划(决策理论规划)9-12章,差分约束下的规划(车)13-15
机器人运动规划在3-8章,第二章的离散运动规划也与此有关,34章理解机器人运动规划的基础,56展示了解决运动规划问题的一些算法技术,78对运动规划基本问题作了一些延伸性探讨,13-15章是非完全约束或者差分约束下的运动规划。
11 12 研究的问题是带有感知不确定性的,在信息空间中进行规划,算法在第11章。
12:34pm
piano mover‘s problem 钢琴搬运问题
运动规划通常忽略动力学和其他的微分约束,主要集中在钢琴的转动和平移上,最近也开始考虑其他方面了,像不确定性、微分约束、模型误差、最优性?
轨迹规划通常指的是拿来运动规划的结果(solution path),在考虑机器人机械特性限制(速度、加速度、加加速度,v,a,j)的情况下去跟踪path 运动。(多项式曲线拟合?)
人工智能、人工智能规划:定义有限数量的动作、应用到离散的状态集合上,通过给出合适的动作顺序建立一个解决方案。
规划就是算法
不仅仅限于组合学和渐近复杂性分析,那是纯算法注重的,这里注重包括很多概念,对于算法不必要,但是对于建模、解决、分析规划问题有帮助。
motivation!
学习规划算法的两个好理由:
- 用机器代替人解决复杂问题
- 规划算法已经在各个工业和科研领域取得了成果
(离散运动规划——强化学习?)
examples :
离散解谜,魔方,数独
discrete puzzles operations and scheduling
路径规划难题
a motion planning puzzle
自动装配问题
an automotive assembly puzzle
自动密封裂缝
sealing cracks in automotive assembly
移动家具
moving furniture
移动机器人导航
navigating mobile robots
玩捉迷藏
playing hide and seek
开发更智能的游戏NPC
making smart video game characters
虚拟人类和仿人机器人
virtual humans and humanoid robots
车辆停靠
parking cars and trailers
鲁莽驾驶
reckless driving
空中或外太空飞行
flying through the air or in space
设计更好的药物
designing better drugs
规划的基本概念
basic ingredients of planning
- state 状态:
状态空间(例如:构型空间c-space,笛卡尔空间末端位姿) 无限不可数或者有限个/无限可数 个状态,规划算法应隐式完全描述状态空间,定义明确。 - time 时间
规划算法做出的一系列决策要按时间顺序执行,不确定时间步长,但要反映出动作的先后 - actions 动作行为
实施动作会进行状态转移,人工智能里面的action 和 operator ,在机器人和控制领域称为input输入和controls,规划公式必须明确动作如何使状态发生变化:离散情况需要一个状态-值方程,连续情况需要常微分方程,对于大多数运动规划问题,通过明确地在状态空间中列举出所有路径点,可以避免引入确切时间。动作可以是随机选择的,它会与实施动作的结果产生(干扰?闭环控制?)actions could be chosen by nature, which interfere with the outcome and are not under the control of the decision maker. 这使得预测不确定性的概念被引入到规划问题中来。uncertainty in predictability。 - initial and goal state初始和目标状态
规划问题的起终点,规划就是为了选择一系列的动作来完成起点到终点的状态转移。 - a criterion 评判标准
这关系到规划的结果:输出的状态和动作,通常从两个方面评价
** feasibility可行性,合理性,完备性,不论效率,只看能否
** optimality 最优性,可行的基础上优化路径表现
大部分机器人学、控制理论相关领域在搞优化,其实没必要?找到可行的path已经足够,评价是否最优的标准很难公式化,公式化的评价标准下,也没有算法能够得到一个符合该最优标准的结果,因此,相比于 no solution at all ,更倾向于得到一个可行解feasible solution。 幸运的是,一些算法得到的可行解与最优解差距并不大。
对于包含概率不确定性的规划问题,最优化被提及到最多,概率通常被用来得到最优解——依据期望代价cost,可行解feasible solution 一般被作为带有不确定性问题的最坏情况进行分析。 - plan 规划
规划提出一个具体的策略,或者决策者的行为,可能是简单的一系列动作,也可能复杂,未来的一切状态如果可以预测,那么规划就可以将未来的动作明确为状态作为自变量的方程,无论状态如何,都可以选择出合适的动作,这可以用其他领域的术语feedback反馈或者reactive plan 反应规划,被动规划。甚至状态可能并不可测,那么动作的选择要根据当前时刻可以得到的数据来进行判断,这被称作information state ,信息状态空间,空间中的动作是有其先决条件的。
算法、规划器和规划
algorithm planner and plan
什么是算法:经典图灵机模型 Turing machine
什么是图灵机
图灵机不适用的算法:The actuation may alter the environment in some way that is later measured by sensors
规划器 planner
规划器是规划算法或者人?
人是完美的规划器,无需额外输入,自带传感器获取环境信息并处理并选择相应的动作
规划 plan
三种使用:
- execution执行
- refineme 改进
- hierarchi inclusion 打包含于,作为更高层次规划器的一个动作