BDI Agent形式化模型

1. BDI Agent的形式化概述

Rao和Georgeff用扩展的计算树逻辑(Computation Tree Logic,CTL*)来描述BDI主体。该逻辑中,模态算子的语义是用可能世界的可达关系来定义的。该形式化方法采用具有多分枝时序未来和单一过去的时态结构去模型化世界,这种时态结构也称为“时间树”。在特定世界中的一个特定时间点称为一个态势事件将一个时间点转换成另一个时间点。原子事件指那些主体直接可完成的事件,并惟一确定时间树上的下一个时间点。非原子事件映射到非邻接的时间点,这使我们能模型化计划的偏序性质。时间树上的分枝可看成表示主体在每一个时刻可能的选择。

 

Rao和Georgeff提出的形式化系统区分状态公式路径公式。状态公式指在一个时间树内的特定时间点上评估它的值;路径公式是根据一个时间树上的特定路径评估其值。系统引入两个模态算子:Optional(可能)和Inevitable(必然)。标准时态算子clip_image002下一个(next),clip_image004将会(Eventually),clip_image006永远(Always),clip_image008知道(until)用于状态公式和路径公式。

 

可能世界模型与常规决策树比较:从一个决策树的选择节点发出的每一条弧都相应于一个可能世界,并且从决策节点发出的每一条弧都相应于可能世界中的选择

尽管一般情况下愿望相互是不一致的,但目标一致的。即目标是从主体的愿望中选择一致的愿望的集合,而且,主体应该相信这些目标是可获得的。

 

信念世界、目标世界和意图世界

图1 信念世界、目标世界和意图世界

 

2. 形式化理论

1) 语法

定义 (状态公式)

1) 任何一阶公式都是状态公式。

2) 如果clip_image012clip_image014是状态公式,且x是个体或事件变量,那么clip_image016是状态公式。

3) 如果clip_image018是一个事件类型,那么clip_image020clip_image022clip_image024clip_image026clip_image028clip_image030是状态公式。

4) 如果clip_image032是状态公式,那么clip_image034clip_image036clip_image038是状态公式。

5) 如果clip_image040是路径公式,那么clip_image042是状态公式。

 

定义 (路径公式)

1) 任何状态公式也是路径公式。

2) 如果clip_image044clip_image046是路径公式,那么clip_image048clip_image050clip_image052clip_image054clip_image056是路径公式。

 

2) 可能世界语义

公式的语义

解释器M定义为一个元组:clip_image058

clip_image060——世界集

clip_image062——原子事件类型集

clip_image064——时间点上的集合

clip_image066——时间点上的一个二元关系

clip_image068——论域

clip_image032[1]——对任何已知的世界和时间点,从一阶实体到clip_image068[1]中元素的一个映射

clip_image071——一个态势,clip_image073是一个特定的世界,clip_image075为一个特定时间点

clip_image077——映射主体的当前态势到它的信念可达世界、目标可达世界和意图可达世界

clip_image079——表示在时间clip_image075[1]从世界clip_image073[1]clip_image081可达的世界集合

 

定义 可能世界clip_image060[1]的每一个世界clip_image073[2],称为一个时间树,可用如下元组定义:clip_image083

clip_image085是世界clip_image073[3]中时间点的集合

clip_image087clip_image066[1]相同,是clip_image090中时间点的约束关系

clip_image092是从临近的时间点到clip_image062[1]中事件的一个映射,即clip_image095clip_image092[1]的值代表在这些时间点之间发生的所有成功事件。要求:若clip_image097,那么clip_image099

clip_image101是从临近的时间点到clip_image062[2]中事件的一个映射,即clip_image103clip_image101[1]的值代表在这些临近时间点之间发生的所有失败事件。要求:若clip_image105,那么clip_image099[1]

显然,弧函数clip_image092[2]clip_image101[2]的定义域是不相交的。

世界clip_image073[4]中的一个全路径是时间点的一个无限序列clip_image107,并有clip_image109。该系统使用clip_image111表示一个特定全路径的世界。

定义 一个子世界定义为具有相同公式真值赋值的一个世界的子树。一个世界clip_image113是世界clip_image073[5]的子世界,表示为clip_image115,当且仅当:

clip_image117

对所有clip_image119clip_image121,这里clip_image123是一个谓词符号

对所有clip_image119[1]clip_image126

clip_image128clip_image087[1]clip_image131中的时间点的一个约束关系

 

定义 clip_image113[1]clip_image073[6]的严格子世界,记为clip_image133,当且仅当clip_image115[1]并且clip_image135

 

定义 在模态算子BEL、GOAL、或INTEND以外的不含有inevitable(或clip_image137optioanl)的合式公式,称为O公式,用clip_image139表示;反之,不含有optional正文字的合式公式定义为I公式,用clip_image141表示。

 

事件的语义

clip_image026[1]表示主体成功执行事件clip_image018[1]

clip_image028[1]表示主体执行事件clip_image018[2]失败

clip_image030[1]表示主体已完成该事件(无论成功或失败)

定义 事件语义满足如下条件:

clip_image147 iff 存在一个clip_image149满足clip_image151

clip_image153 iff 存在一个clip_image149[1]满足clip_image155

 

信念、目标和意图的语义

Cohen和Levesque将每一个可能世界处理为表示一系列事件的时间线(Time Line),时序上能无限扩展到过去和未来。Rao等人则不同,将每一个可能世界看成时间树,每一个时间树表示在一个特定的世界里一个主体能够挑选的可能事件序列(Optional Courses of Events)。信念关系将一个时间点上的可能世界映射到其他的多个可能世界。一个主体在时间t具有信念clip_image157,表示为clip_image159,当且仅当在时间t的主体所有信念可达世界里clip_image157[1]都为真。

时间树表示的世界

图2 时间树表示的世界

 

假设在clip_image163clip_image165时刻为真的公式是clip_image167clip_image169,而在clip_image171clip_image165[1]时刻为真的公式是clip_image167[1]clip_image173。得出结论:clip_image175clip_image165[2]时刻clip_image177clip_image179

 

主体的目标可达世界可看成信念可达世界的子世界,它是主体希望进入的态势。意图可达世界看成目标可达世界的子世界,它是主体选择进入的态势。因此,主体通过希望的未来路径从信念可达世界到一个目标可达世界,并且通过承诺一个特定的希望未来路径从目标可达世界到一个意图可达世界。

 

定义 信念、目标和意图的语义定义如下:

clip_image181 iff clip_image183

clip_image185 iff clip_image187

clip_image189 iff clip_image191

 

3. 基本公理与语义条件

信念-目标相容性

信念-目标相容性公理表示如果主体采用一个O公式clip_image139[1]作为目标,则主体相信这一公式:

clip_image193

 

目标-意图相容性

目标-意图相容性公理表明,如果主体采用一个O公式clip_image139[2]作为意图,那么主体一定已将该公式作为将要获得的目标。

clip_image195

 

导致行为的意图

意图到行为公理表明主体的意志承诺(Volitional Commitment),即如果主体具有一个针对原子行为e的意图,那么它将执行这个行为。

clip_image197

 

关于意图的信念

如果一个主体具有一个意图,那么它相信它所具有的这个意图。

clip_image199

 

关于目标的信念

如果主体具有一个获得clip_image032[2]的目标,那么它相信它所具有的这个目标。

clip_image202

 

关于意图的目标

如果一个主体打算获得clip_image032[3],主体必须具有意图clip_image032[4]的目标。

clip_image204

 

知道原子事件

要求主体知道发生在世界里的所有原子事件,即要求主体相信一个原子行为已完成,不一定知道是否该行为已成功完成。

clip_image206

 

没有无限的延期

要求主体不要无限地拖延它的意图。即如果一个主体形成了一个意图,那么未来某个时刻它将放弃这个意图。

clip_image208

 

4. 作为公理的不同承诺

盲目承诺策略

盲目承诺主体是指主体一直维护其意图,直到它相信已实现了这些意图。

clip_image210

 

单一意向承诺策略

主体只要相信它的意图仍然是可能的,它就一直维护这些意图。

clip_image212

 

开放意向承诺策略

只要意图仍然是它的目标它就维护这些意图。

clip_image214

 

参考文献:

[1] Rao A S, Georgeff M P. Modeling rational agent within BDI architecture. In:Allen J, Fikes R,Sanewall E eds. Proceedings of the second international conference on principles of KRR, Morgan Kaufmann, 1991

[2] 张维明. 智能协作信息技术. 北京: 电子工业出版社, 2002.4

转载于:https://www.cnblogs.com/6DAN_HUST/archive/2010/09/08/1821526.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值