Artificial Intelligence Planing (AIP) PDDL 人工智能规划 备考

1 classical planning

kinds of planning

  • online
  • discrete
  • deterministic
  • single-agent
  • game-theoretic planning
  • fully observable
  • Sequential

Domain-Independence Automated Planning=GPS

  • GPS = general problem solving
  • create one planning algorithm that preforms sufficiently well on many application domain.

plan validation

use VAL plan to independently verify if the plan is correct.

什么是plan

在这里插入图片描述

plan的最优解和次优解

因为有的planing找不到最优解,所以产生了Optimal Classical PlanningSatisficing laical Planning的区别:
在这里插入图片描述

1.1 planner的更新换代

transition systems

< S , s 0 , S ∗ , A , c o s t , T > <S,s_0,S_*,A,cost,T> <S,s0,S,A,cost,T>
< s t a t e s , i n i t a l , g o a l , a c t i o n s , c o s t , t r a n s i t i o n r e l a t i o n > <states,inital,goal,actions,cost,transition relation> <states,inital,goal,actions,cost,transitionrelation>
在这里插入图片描述
很快,在处理问题的时候发现transition system不好!哪里不好呢?就是定义S为state不好,数量太大了。

  • 所以下一代为STRIPS

STRIPS

< V , I , G , A > <V,I,G,A> <V,I,G,A>
< s t a t e v a r i a b l e , i n i t i a l , g o a l , a c t i o n s > <state variable,initial,goal,actions> <statevariable,initial,goal,actions>

在这里插入图片描述

这个好啊,只用variable来表示,就可以表示2的variable次方的state了,假设variable都是布尔变量。

SAS+

这个允许使用non-binary的state variables
在这里插入图片描述

PDDL

  • 结合了STRIPS 和ADL
  • ADL :Abstract Description Language。是一些逻辑谓词,first-order logic。
  • PDDL describes the world in a schematic way. This makes the encoding much smaller and easy to write.
  • grounding:Planner translate the schematic input into STRIPS in a pre-process.

一下应该都是ADL的内容

  • disjunctions:
    在这里插入图片描述

  • conjunctions:
    在这里插入图片描述

  • condition
    在这里插入图片描述

  • negated
    在这里插入图片描述

PDDL2.1 Hierachy(5 levels)
  • STRIPS/ADL:conjunction,disjunction,negated,condition
  • numeric:+,-,/,*,increase,decrease
  • durative action:at start, at end, over all
  • continuous change
  • processes and event

根据numeric和durative action,我们可以使用更加复杂的衡量函数metric
在这里插入图片描述


PDDL2.2
  • derived predicates
  • timed initial leterals
    在这里插入图片描述
PDDL3
  • hard comstraints
  • preference
  • state trajectory constraints
PDDL+
  • temporal numeric change
  • processes
  • events

2 the big three planning approaches

2.1 Graph/SAT planning

planning graph

  • odd layers is “state levels”
  • even layers is “action levels”
    S i S_i Si, A i A_i Ai每次只能执行一个action,但是全部的possible action都是要画出来的。
    在这里插入图片描述
    画图的时候,同一层同一元素可以使用多次,然后不产生影响。仅仅对同一层而言。
    现在我们来执行mutex
mutex(新知识点)
  • mutually exclusive
  • interference: 两个动作 effect ---- precondition
  • Competing need:两个动作 precondition----precondition
  • inconsistent support: all ways of creating them are mutex
PG algorithm
  • grow PG until all goals are reachable and none are pair wise mutex.
  • if can’t search PG for a valid plan, add a level
  • on one level, complete all goals, backward chain
  • 选择可以实现目标的non-mutex的subset actions,把他们的precondition作为前一层的goals。

SAT planing

在这里插入图片描述
看不懂,76,77,78

2.2 symbolic search planing

BDDS (不懂87-90)

  • binary decision diagrams
  • exponentially large state sets -> polynomially sized BDDs
    在这里插入图片描述
ordering

ordering不同会造成状态复杂度的不同
在这里插入图片描述

reduction

在这里插入图片描述

###Symbolic planning
在这里插入图片描述

2.3 Heuristic State-Space Search

search space

state-space 都是来回往复的directed graph,所以如何避免go round in circles

forward search
  • forwards search from the initial state, with a closed list, builds a tree, only one path into each node, no backwards edges.
  • closed list:states already dealt with
  • Open list:states to deal with
  • breadth-first & depth-first
    在这里插入图片描述

Heuristic search planning

  • 注意h,g的含义
  • h越靠近目标越小,g距离初始点越远越大

在这里插入图片描述

properties of heuristics
  1. admissibility: 从s开始的所有目标达成计划的成本下限是h(s)。不会过高的估计到达目标的代价
    在这里插入图片描述
  2. Consistency:
    在这里插入图片描述
  3. additivity
    在这里插入图片描述
DIJKSTRA and A*(百度)

3 heuristic 5 families

3.1 delete relaxation

在这里插入图片描述
在这里插入图片描述

3.1.1 RPG

  • RPG:Relaxed planning graph
    在实现目标之后,开始倒推,goal的achiever的precondition加入前面一层的goal,这样就可以知道每一层的goal,这样就是一种智能搜索。
    在这里插入图片描述

3.2 abstraction

在这里插入图片描述

abstraction heuristic

是最小的cost从 α ( s ) \alpha(s) α(s)到目标抽象集合 S α S^\alpha Sα α \alpha α是abstraction function.
在这里插入图片描述

abstraction projection

在这里插入图片描述

pattern database PDB

  • pattern就是上图中的package,truckA,我们只考虑的变量
  • 每一个abstract state 到 abstract goal state的最优距离会被存储到database。
  • PDB expensive in time and memory所以我们要选择好的pattern

additive PDB

在这里插入图片描述

SCP(不懂)

  • cost partition 是把一个cost function分割成多个,使得每一个自function相加的和不大于原cost function
  • zero-one是一种特殊的partition,其中<c1,c2,…,cn>每一个function对于一个特定的action返回原cost function的值,对其他action返回0
  • Saturated Cost Partition
    在这里插入图片描述

3.3 critical paths(不是重点)

在这里插入图片描述

3.4 landmarks

被用来做cost estimate
在这里插入图片描述

optimal cost partition(LP)(不考)

  • linear program
    在这里插入图片描述

3.5 network flows(不是重点)

在这里插入图片描述

4 temperal planning

  • at start; at end; over all

4.1 snap action

  1. 如果在一个durative action执行的过程中,goal达成了。怎么办?
    在这里插入图片描述
  2. 如果在执行的过程中,over all条件被打破了怎么办
    回答:使用imply
    在这里插入图片描述
  3. temperally sound and logical sound
    logical sound 是指不考虑时间的情况下你得出的plan在逻辑上是行得通的,temporal sound是指还要考虑时间因素(比如deadline)
    在这里插入图片描述

4.2 decision epoch planning(不懂)

在这里插入图片描述

在这里插入图片描述

4.3 simple temporal networks (STN)

  • a STN problem is consistent iff the distance graph has no cycles.
    在这里插入图片描述

  • a negative cycle then the temporal constraints are inconsistent.

constraint

在这里插入图片描述

sample

在这里插入图片描述

shortest paths

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

STN with partially ordered plan(懂)

sample of snap actions and STN

在这里插入图片描述

4.4 timed initial literal

deadline

在这里插入图片描述

time window

在这里插入图片描述
在这里插入图片描述

5 heuristic guidance(211)

6 preferences

在这里插入图片描述

6.1 linear time logic (LTL)

在这里插入图片描述

PDDL->LTL

在这里插入图片描述

在这里插入图片描述

LTL->automata

在这里插入图片描述

automata

  • PDDL3 always a best position in the further from E-Vio the better.
  • E-Sat: the preference is satisfied in S and can never become unsatisfied.
    在这里插入图片描述

compile with preference

在这里插入图片描述

RPG heuristic

RPG里面,h就单纯按照forgo的preference的数量来算。
在这里插入图片描述

distance and cost

在这里插入图片描述

  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
人工智能和LISP(LISt Processing)是紧密相关的两个概念。LISP是一种编程语言,最早于1958年由美国计算机科学家约翰·麦卡锡(John McCarthy)设计并开发。正是基于LISP语言的特性,人工智能领域得到了巨大的推动和发展。 LISP的设计使其非常适用于处理符号化的数据和执行复杂的逻辑运算。这使得LISP成为早期人工智能研究中的首选编程语言。研究人员利用LISP的高度灵活性和表达能力,构建了许多能够模拟人类智能的系统。 LISP为人工智能的发展提供了强大的工具和理论基础。其中最著名的例子是LISP语言中的列表(list)数据结构,它提供了一种方便的方式来存储和操作符号化的知识。这在构建专家系统和知识表示方面起到了重要的作用。 另一个与LISP和人工智能密切相关的概念是LISP的元编程能力。通过LISP的元编程功能,研究人员可以在运行时修改和扩展程序逻辑,这对于开发智能系统的学习和自适应能力非常有帮助。例如,利用LISP的元编程能力,人工智能研究人员能够实现基于案例推理的系统,通过不断添加新的规则和示例,使系统能够从经验中学习。 总之,LISP语言为人工智能的发展做出了巨大贡献。它提供了强大的符号化处理能力和元编程能力,使研究人员能够构建智能系统并实现学习和自适应。至今,LISP仍然在人工智能研究中扮演着重要的角色,它仍然是研究人员用于开发智能系统的一种首选语言。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值