2021-11-07 Planning algorithm -1

本书四章内容:

介绍,连续空间运动规划3-8章,不确定性的规划(决策理论规划)9-12章,差分约束下的规划(车)13-15

机器人运动规划在3-8章,第二章的离散运动规划也与此有关,34章理解机器人运动规划的基础,56展示了解决运动规划问题的一些算法技术,78对运动规划基本问题作了一些延伸性探讨,13-15章是非完全约束或者差分约束下的运动规划。
11 12 研究的问题是带有感知不确定性的,在信息空间中进行规划,算法在第11章。

12:34pm

piano mover‘s problem 钢琴搬运问题

运动规划通常忽略动力学和其他的微分约束,主要集中在钢琴的转动和平移上,最近也开始考虑其他方面了,像不确定性、微分约束、模型误差、最优性?
轨迹规划通常指的是拿来运动规划的结果(solution path),在考虑机器人机械特性限制(速度、加速度、加加速度,v,a,j)的情况下去跟踪path 运动。(多项式曲线拟合?)

人工智能、人工智能规划:定义有限数量的动作、应用到离散的状态集合上,通过给出合适的动作顺序建立一个解决方案。
在这里插入图片描述

规划就是算法
不仅仅限于组合学和渐近复杂性分析,那是纯算法注重的,这里注重包括很多概念,对于算法不必要,但是对于建模、解决、分析规划问题有帮助。

motivation!

学习规划算法的两个好理由:

  1. 用机器代替人解决复杂问题
  2. 规划算法已经在各个工业和科研领域取得了成果

(离散运动规划——强化学习?)

examples :

离散解谜,魔方,数独
discrete puzzles operations and scheduling
路径规划难题
a motion planning puzzle
自动装配问题
an automotive assembly puzzle
自动密封裂缝
sealing cracks in automotive assembly
移动家具
moving furniture
移动机器人导航
navigating mobile robots
玩捉迷藏
playing hide and seek
开发更智能的游戏NPC
making smart video game characters
虚拟人类和仿人机器人
virtual humans and humanoid robots
车辆停靠
parking cars and trailers
鲁莽驾驶
reckless driving
空中或外太空飞行
flying through the air or in space
设计更好的药物
designing better drugs

在这里插入图片描述

规划的基本概念

basic ingredients of planning

  • state 状态:
    状态空间(例如:构型空间c-space,笛卡尔空间末端位姿) 无限不可数或者有限个/无限可数 个状态,规划算法应隐式完全描述状态空间,定义明确。
  • time 时间
    规划算法做出的一系列决策要按时间顺序执行,不确定时间步长,但要反映出动作的先后
  • actions 动作行为
    实施动作会进行状态转移,人工智能里面的action 和 operator ,在机器人和控制领域称为input输入和controls,规划公式必须明确动作如何使状态发生变化:离散情况需要一个状态-值方程,连续情况需要常微分方程,对于大多数运动规划问题,通过明确地在状态空间中列举出所有路径点,可以避免引入确切时间。动作可以是随机选择的,它会与实施动作的结果产生(干扰?闭环控制?)actions could be chosen by nature, which interfere with the outcome and are not under the control of the decision maker. 这使得预测不确定性的概念被引入到规划问题中来。uncertainty in predictability。
  • initial and goal state初始和目标状态
    规划问题的起终点,规划就是为了选择一系列的动作来完成起点到终点的状态转移。
  • a criterion 评判标准
    这关系到规划的结果:输出的状态和动作,通常从两个方面评价
    ** feasibility可行性,合理性,完备性,不论效率,只看能否
    ** optimality 最优性,可行的基础上优化路径表现
    大部分机器人学、控制理论相关领域在搞优化,其实没必要?找到可行的path已经足够,评价是否最优的标准很难公式化,公式化的评价标准下,也没有算法能够得到一个符合该最优标准的结果,因此,相比于 no solution at all ,更倾向于得到一个可行解feasible solution。 幸运的是,一些算法得到的可行解与最优解差距并不大。
    对于包含概率不确定性的规划问题,最优化被提及到最多,概率通常被用来得到最优解——依据期望代价cost,可行解feasible solution 一般被作为带有不确定性问题的最坏情况进行分析。
  • plan 规划
    规划提出一个具体的策略,或者决策者的行为,可能是简单的一系列动作,也可能复杂,未来的一切状态如果可以预测,那么规划就可以将未来的动作明确为状态作为自变量的方程,无论状态如何,都可以选择出合适的动作,这可以用其他领域的术语feedback反馈或者reactive plan 反应规划,被动规划。甚至状态可能并不可测,那么动作的选择要根据当前时刻可以得到的数据来进行判断,这被称作information state ,信息状态空间,空间中的动作是有其先决条件的。

算法、规划器和规划

algorithm planner and plan

什么是算法:经典图灵机模型 Turing machine

在这里插入图片描述

什么是图灵机
在这里插入图片描述
在这里插入图片描述
图灵机不适用的算法:The actuation may alter the environment in some way that is later measured by sensors
在这里插入图片描述
在这里插入图片描述

规划器 planner

规划器是规划算法或者人?
人是完美的规划器,无需额外输入,自带传感器获取环境信息并处理并选择相应的动作

规划 plan

三种使用:

  • execution执行
    在这里插入图片描述
  • refineme 改进
    在这里插入图片描述
  • hierarchi inclusion 打包含于,作为更高层次规划器的一个动作
    在这里插入图片描述
This book presents a unified treatment of many different kinds of planning algorithms. The subject lies at the crossroads between robotics, control theory, artificial intelligence, algorithms, and computer graphics. The particular subjects covered include motion planning, discrete planning, planning under uncertainty, sensor-based planning, visibility, decision-theoretic planning, game theory, information spaces, reinforcement learning, nonlinear systems, trajectory planning, nonholonomic planning, and kinodynamic planning. "Motion planning is an important field of research with applications in such diverse terrains as robotics, molecular modeling, virtual environments, and games. Over the past two decades a huge number of techniques have been developed, all with their merits and shortcomings. The book by Steve LaValle gives an excellent overview of the current state of the art in the field. It should lie on the desk of everybody that is involved in motion planning research or the use of motion planning in applications." _ _ | | | | _ _ | | _____ ____ _____| | _| |_ ___ ____ ____ _____ ____ _| |_ ___ | || ___ |/ _ (____ | | (_ _) _ / ___) ___) ___ | _ (_ _)/___) | || ____( (_| / ___ | | | || |_| | | | | | ____| | | || |_|___ | _)_____)___ _____|_) __)___/|_| |_| |_____)_| |_| __|___/ (_____| -LEGAL TORRENTS Purpose: create a balance, share the already free stuff, public domain works, freeware, free music, free ebooks, articles, manifestos, movie trailers, and more. show the copyright owners that torrent websites shouldn't bear the responsibility of what their users upload, torrent websites are very much similar to google.. users upload what they want to upload, download what they want to download, and search for what they want to search.. by creating this balance and sharing the already free stuff, we hope to take the pressure of torrent websites.. _ _ | | | | _ _ | | _____ ____ _____| | _| |_ ___ ____ ____ _____ ____ _| |_ ___ | || ___ |/ _ (____ | | (_ _) _ / ___)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值