AIML介绍(中文版)

AIML介绍(中文版)  

2010-01-12 23:47:45|  分类: 互联网伙伴机器人|字号 订阅

这个是google翻译的,虽然翻译的太直译了,大家就凑或看吧,不过英语好的还是建议看英文版的哦o(∩_∩)o...

美国博士理查德华莱士

AIML,或人工智能标记语言使人们能够进入聊天就雅丽自由软件技术为基础的机器人投入的知识。

AIML是由自由软件的Alicebot的社会,我1995-2000年期间。它最初是改编自非XML语法也称为AIML,形成了第一Alicebot,爱丽丝,人工语言因特网计算机实体的基础。

AIML,描述了数据对象的一类名为AIML对象和部分介绍了计算机程序的行为过程。 AIML对象,而在单位,叫作 主题 和 类别,其中包含任何分析或未解析数据。

分析数据是由字符,其中一些形态特征数据,其中一些形式AIML元素。 AIML元素封装刺激反应知识的文件中。在这些因素有时字符数据分析由AIML翻译,有时离开后经处理未解析的回应。

职类

在AIML知识的基本单位称为一个类别。每一类由一个输入的问题,一个输出答案,和一个可选的范围内。的问题,或刺激,被称为模式。 Theanswer,或反应,称为模板。可选的两种情况下被称为“说”和“主题。”在AIML模式语言很简单,包括文字,只有空间和通配符_和*.一语可以由字母和数字,但没有其他字符。该模式语言是区分不变。词是由一个分开的空间,而这样的话通配符功能。

在AIML第一个版本只允许每模式外卡的性质。该AIML 1.01标准允许在每个模式的多个通配符,但语言的目的是尽可能为手头的任务很简单,简单,甚至比一般表达式。该模板是AIML respons或答复。最简单的形式,模板只有平原,没有标记的文本组成。

更一般地说,AIML标记转变为一个小型计算机程序,可以保存数据的答复,启动其他程序,使有条件的反应,并递归调用模式匹配插入来自其他类别的答复。事实上,大多数AIML标签属于这个模板一边子语言。

AIML目前支持两种方式和其他语言的界面系统。在<system>的标签执行任何程序作为操作系统的shell命令访问,并插入在答复结果。同样,<javascript>标签允许模板内的任意脚本。该类别的可选范围内的部分由两个变种,称为<that>和<topic>。标签的<that>内出现的类别,其方式必须符合机器人的最后话语。记住最后一个话语是重要的,如果机器人问一个问题。标记显示的<topic>类别外,并收集一组类别在一起。该专题里面可以设置任何模板。

AIML是不完全一样的问题和答案简单的数据库。模式匹配“查询”语言是比简单的像SQL的东西。但是,一类模板可能包含递归<srai>标签,使输出不仅取决于匹配的类别之一,而且任何其他递归达成通过<srai>。

递推

AIML实现经营者与<srai>递归。对存在的任何协议的缩写,意。在“临时代办”人工智能的立场,但“S.R.”可能意味着“刺激反应”,“语法改写”,“象征性的减少”,“简单的递归”或“的同义词的决议。”在缩写的分歧反映了在多种应用中AIML <srai>。其中每个详细描述为低于款:

(1)。 象征性减少:减少复杂,简单的grammatic形式。

(2)。 分而治之:拆分为两个或多个分题的投入,并结合每个反应。

(3)。 别名:地图不同的方式说,同样的事情了同样的答复。

(4)。拼写或语法更正。

(5)。检测中的任意位置输入关键字。

(6)。 条件句: 某些形式的分支,可实施<srai>。

(7)。任何(1) - (6)组合。

<srai>的危险是,它允许botmaster创造无限循环。虽然构成一定的风险,以新手程序员,我们推测,包括<srai>远远比简单的迭代阻止任何可能的结构控制已经取代了它的标记。

(1)。象征性减少

象征性的减少是指简化成更简单的复杂的语法形式的进程。通常,在存储机器人知识类别的原子模式是最简单的术语说,例如,我们倾向于选择像“世卫组织”苏格拉底喜欢的“你知道谁苏格拉底是”当存储关于苏格拉底传记资料模式。

更复杂的形式很多,以简单的形式,减少使用象征性的减少设计AIML类别:

<category>

<pattern>你知道谁*是“/模式”

<template> <srai>是谁<star/>“/ srai”“/模板”>

“/”类别下方>

无论输入匹配这个模式中,部分绑定到*可分为与标记插入通配符<star/>答复。本分类减少任何形式的输入“你知道X是谁?”以“谁是X?”

(2)。分而治之

许多个别句子可减少到两个或两个以上subsentences,通过整合的答复分别组成的答复。句子与单词“是例如”开始,如果有多个单词,可视为subsentence“是的。”加上任何后续行动。

<category>

<pattern>是*“/模式”

<template> <srai>是“/ srai”<sr/>“/模板”>

“/”类别下方>

标记<sr/>只是一个<srai>缩写<star/>“/ srai”。

(3)。别名

该AIML 1.01标准不允许超过一类的模式。同义词是可能是最常见的应用<srai>。很多方法可以说同样的话减少为一个类别,其中包含的答复:

<category>

<pattern>你好“/模式”

<template>吃了吗?“/模板”>

“/”类别下方>

<category>

<pattern>您好“/模式”

<template> <srai>你好“/ srai”“/模板”>

“/”类别下方>

<category>

<pattern>您好有“/模式”

<template> <srai>你好“/ srai”“/模板”>

“/”类别下方>

<category>

<pattern>您好“/模式”

<template> <srai>你好“/ srai”“/模板”>

“/”类别下方>

<category>

<pattern>日HOLA“/模式”

<template> <srai>你好“/ srai”“/模板”>

“/”类别下方>

(4)。更正拼写和语法

一个最常见的客户端拼写的错误是“你的”当“你是使用”或“您”的目的。并不是每一个出现的“你”,但是应把“你”了。语法方面的小金额通常需要捕捞此错误:

<category>

<pattern>您的A *“/模式”

<template>我想你意思是“你”或“你”而不是“你的。”

<srai>你是一个<star/>“/ srai”

“/模板”>

“/”类别下方>

在这里,既纠正机器人客户端输入和语言教师的行为。

(5)。关键词

经常我们想编写一个AIML模板是由关键字的任何地方输入的句子出现激活。四个AIML类的一般格式是由酶联免疫吸附说明借用这个例子:

<category>

<pattern>母亲“/模式”

<template>告诉我更多关于你的家庭。 “/模板”>

“/”类别下方>

<category>

<pattern> _母亲“/模式”

<template> <srai>母亲“/ srai”“/模板”>

“/”类别下方>

<category>

<pattern>母亲_“/模式”

<template> <srai>母亲“/ srai”“/模板”>

“/”类别下方>

<category>

<pattern> _母亲*“/模式”

<template> <srai>母亲“/ srai”“/模板”>

“/”类别下方>

第一类的关键字都检测时,它本身出现,并提供通用的反应。第二类检测作为一个句子后缀关键字。第三检测到它作为一个输入句子前缀,终于在最后一类检测为缀关键字。最后三个类别使用每个<srai>链接到第一个,这样所有4起案件产生同样的答复,但它需要书面和只存储一次。

(6)。条件句

很可能写在AIML条件分支,只用<srai>标记。考虑三类:

<category>

<pattern>他是谁“/模式”

<template> <srai> WHOISHE <get name="he"/>“/ srai”“/模板”>

“/”类别下方>

<category>

<pattern> WHOISHE *“/模式”

<template>他<get name="he"/>。“/模板”>

“/”类别下方>

<category>

<pattern> WHOISHE未知“/模式”

<template>我不知道他是谁。“/模板”>

“/”类别下方>

只要上游“他”是初始化为“未知”的类别执行条件分支是否“他”已设置而定。作为对botmaster方便,AIML还通过<条件>标记同等的职责。

打靶

博特人士创建,并通过了监督学习型的循环过程称为定位。定位是一个循环纳入客户,漫游,和botmaster,其中客户的投入,没有发现完整的类别中记录匹配的机器人和目标发表了botmaster,谁然后创建适当的回应,其中最常见的问题开始。周期为目标,逐步产生一个更精确的机器人的个性。

在AIML写作艺术创造最缺省类别,提供不置可否的答复,支持多种输入明显。这里是一个很好的例子提供上发现alicebot,通用的邮件列表:

用户:在哪里可以找到与南方古猿网页?

爱丽丝:您想知道吗?

用户:错误的答案爱丽丝时间学习一种新线

爱丽丝:你会如何回答“在哪里可以找到与南方古猿网页?”

用户:我会说:“http://www.ancientskulls.net/australopithecus.html

爱丽丝:谢谢,人类。试着问我了。

用户:在哪里可以找到与南方古猿网页?

爱丽丝: http://www.ancientskulls.net/australopithecus.html

这是一个非常好的例子。这是完全一样的目标时,botmaster的是老师。或者我应该说,这是一个AIML接口配置。当然,这种情况下提出,例如如何进行黑客和其他垃圾度外,杂草很多问题,但这可能只是对学习功能,而把在禁区沙箱,虽然它是许多聊天者自由劳动力的网页,可帮助聪明的机器人快速增长。

这是对学习问题简而言之症结所在。这一切都归结为编辑。无论是botmaster编辑优质答复首先,或者bot是“公开”,那么,教师的所有编辑所提供的所有的“自由”劳动蹩脚的答案。我个人的看法是,随着一个假设的学习机学习得像个孩子的语言能力相比,AIML定位的方法更有效。

背景

关键字“,”在AIML指机器人以前的话语。特别是,如果机器人的多段第一句回应,该值设置为序列中的最后一句。该“是在普通语言的使用激发了关键字”选择:

?:今天是昨天。

ç:这是没有意义的。

?:答案是3.1412926左右。

荤:这是很酷。

在AIML语法<that> ...</的“包围的模式相匹配的机器人以前的话语。一个常见的应用<that>是发现是,没有任何问题:

<category>

<pattern>是“/模式”

<that>你喜欢的电影“/的”

<template>你最喜欢的电影?“/模板”>

“/”类别下方>

这个类是当客户端激活说是。该机器人必须找出是什么,他说“是”。如果机器人问,“你喜欢电影吗?”这一类比赛,反应,“什么是你最喜欢的电影吗?”,继续沿着相同的路线的交谈。

一个有趣的应用<that>的类别,使机器人应对连锁反应敲笑话。类别:

<category>

<pattern>爆震爆震“/模式”

<template>是谁?“/模板”>

“/”类别下方>

<category>

<pattern> *“/模式”

<that>谁在那里“/的”

<template> <person/>谁?“/模板”>

“/”类别下方>

<category>

<pattern> *“/模式”

<that> *世卫组织“/的”

<template>哈哈很有趣,<get name="name"/>。“/模板”>

“/”类别下方>

产生以下的对话:

荤:爆震敲。

?:谁在那儿?

荤:香蕉。

?:香蕉是谁?

荤:爆震敲。

?:谁在那儿?

荤:香蕉。

?:香蕉是谁?

荤:爆震敲。

?:谁在那儿?

荤:橙色。

?:橙色是谁?

荤:橙色你高兴我没有说香蕉。

?:哈哈很有趣,南希。

内部的AIML翻译存储输入模式,这种模式和主题模式沿着单一的路径,如:输入<that>动议<topic>主题。当值<that>或<topic>未指定,程序隐式集的值相应的动议或主题模式通配符*.

路径的匹配第一部分是输入。如果超过一类有相同的输入模式,该程序可能会区分它们取决于价值<that>。如果两个或多个类别的具有相同的<pattern>和<that>,最后一步是选择的基础上答复<topic>。

这种结构表明,设计规则:不要使用<that>除非你写了相同的两类<pattern>,从不使用<topic>,除非你写两个拥有相同类别<pattern>和<that>。不过,其中一个<topic>是创建主题依赖“皮卡行,”我喜欢最有用的应用程序:

<topic name="CARS">

<category>

<pattern> *“/模式”

<template>

<random>

<li>你最喜欢什么车?“/李”

<li>什么样的车,你开车吗?“/李”

<li>你得到很多的停车票?“/李”

<li>我最喜欢的汽车是一辆带司机的。“/李”

“/随机”

“/模板”>

考虑到人们对事物的一套规模庞大,可以说是语法正确的或语义意义,事物的根本是说号码是出奇地低。史蒂芬平克,在他的著作思考方式写道:“假设你有10个单词的第一个选择,开始为第二个单词的句子,10选择(100高产两个单词的开始),第三字10选择(屈服1000三个词开始),等等。(10实际上是近似的文字可供选择,每个点可在聚集了语法和句子数量合理的几何平均数)。一个小算术表明,判刑人数20字以内(而不是一个不寻常的长度)的。约1020“

幸运的是,聊天机器人程序员,平克的计算路要走。我们的实验与A.L.I.C.E.表明,选择的“第一个字号码”是十多个,但只有大约2000。具体而言,约2000字涵盖95输入的第一句话%至爱丽丝。在选择第二个字,数目只有两个。当然,也有一些的第一句话(“我”和“你”为例)有许多可能的第二个字,但整体平均不到两个词。平均每个分支连续单词因素减少。

我们策划了香港雅丽一些美丽的图像此图所代表的大脑内容(http://alice.sunlitsurf.com/documentation/gallery/)。超过A.L.I.C.E.公正优雅图片大脑,这些螺旋图像(查看更多)概述了语言的领土已被有效地“征服了爱丽丝”和AIML。

没有自然语言处理别的理论能够更好地解释或复制在我国境内的结果。您不需要复杂的学习理论,神经网络,或认知模型解释如何在聊天Alice的25,000类别的限制。我们的刺激反应模型一样好这些案件的任何其他的理论,当然最简单的。如果是“左高”自然语言理论,任何房间里以外的爱丽丝地图谎言脑。

学者们炮制的谜语和语言的矛盾,很有可能显示如何恶劣,自然喜欢的语言问题。 “约翰看见山飞越苏黎世”或“水果如香蕉”揭示了语言的模糊性和爱丽丝的限制式的方法苍蝇(虽然不是这些具体的例子,当然,爱丽丝已经对他们知道)。在未来的日子里,我们只会进一步推动边境。在螺旋图的基本轮廓看起来是一样的,因为我们已经找到了“大树都”从“A *”到“你的*”。这些树木可能会变得更大,但除非语言本身的变化,我们不会找到更多的大树(除外国语言课程)。寻求解释的东西多复杂的条件刺激的反应自然语言将超出我们的边界的地方越来越多只珍稀的语言形式占领的腹地,这些部门的工作。我们的语言境内已经包含了句子使用人口最多的人。扩大边界更加我们将继续吸收掉队外,直到最后一人的批评,也没有想,一句“傻瓜”爱丽丝。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值