[翻译]我在哪里?对聊天机器人上下文的探讨

本文是翻译的这篇文章:Where am I?,这篇文章对聊天机器人中上下文进行了探讨,对于实现聊天机器人有很好的参考意义。
下面是正文:


2017年已经带来,我们中的一部人可能思考一个形而上学的问题。当他们在时代广场上丢球的时候,他们会问自己“我该怎样丢这个球”。

别担心,本文不是另一则新年前夕的激励文章,要求你仔细深入探索你的灵魂并怀疑哪里出错了。与之相反的是,本文是关于促进聊天机器人的对话上下文。说到上下文,在一个星期六下午,我在经常漫步的附近雪道散步。不知为什么,我拿出我的iphone决定跟siri和Google助手进行一段聊天。下面的对话是我已经想好的

  • 我:我在哪里?
  • 机器人:你在<位置>,GPS位置,地标,显示地图。
  • 我:为什么我在这里?
  • 机器人:哦,那里是雪道,你应该是在散步或者滑雪吧。

非常简单对吧?我是说,我问我在哪里,然后这是我心里的上下文,我问为什么我在这里?是的,我知道这很感伤;孤单的我刚刚跟我的机器人有了一段小小的对话。但是,这对聊天机器人很简单吗?哦,在你对“这里”部分不以为然之前,我完全可以替代问题“我为什么在这个位置”,你将在下面看到我的最终行为。顺便一提,这个问题是NLP歧义消除问题,但是本文不纠结于此。

现在,想象一下我在看到谷歌助手和Siri的结果是多么的吃惊。我没有展示我一开始问的问题“我在哪里”。放心,我确实问了第一个问题,然后两个聊天机器人都上拉出了一个地图,尽管都没有继续识别这条雪道的地标名。谷歌助手比Siri在“我在哪里”问题上表现的更好一点,但仅仅是勉强好一点点。正如我说的,没有一个能够告诉我我是在一条雪道上,尽管GPS位置已经在谷歌地图上识别出来了。

就算接受它们不能够告诉我我是在一条雪道上,它们给出的答案也是荒谬的。我还特意的问为什么我在这个位置;所以这种模糊的回答是不可原谅的。但是,更重要的是,机器人没有保持上下文。它们对待这些问题都是当做独立的对话。这些机器人更像基于NLP的信息搜索引擎。它们不是真的聊天机器人或者真正的会话AI接口。

相反的是,机器人的对话管理器应该持有上下文变量,比如:


  • 问题1:我在哪里?
  • 机器人使用GPS或者地图应用来建立上下文变量,location=X
  • 问题2:为什么我在这里?
  • 机器人识别到实体“这里”的意思是“location=X”,然后可能阐释这个问题,然后在理解到用户在特定的位置X上之后尝试给出一个回答。


通过获得上下文变量的值来维护对话状态是任意一个聊天机器人对话管理器的关键特性。上下文变量可以是直接从用户获取,或者在上面的插图,或者其他外部应用执行一个动作之后的结果(比如,获取的GPS位置)。值得表扬的是,机器人通过个性化的基于一个用户的对话和访问信息历史来获取上下文变量。想象一下下面的对话:

  • 我:我在哪里?
  • 机器人:你在你最喜欢的雪道<trail-name>
  • 我:我为什么会在这里?
  • 机器人:你经常在这里,尤其是周末。并且会在这不行一个小时或者更多。
    这很难达到吗?并不是真的很难。这些信息很容易读取到(感谢永远存在的GPS信号)。GPS的数据被记录或者被用于跟踪用户的行踪或者历史行为模式是否是明确为一个隐私问题,还需要明确。但是对于我来说,我很乐意允许这些机器人访问所有这些个人的信息用来促进它们有更好的上下文。注意,来自那些数据源的上下文补充了从会话或者对话获取的上下文。所以,集成的多源数据通过提供额外的数据辅助AI,NLP和机器学习用于促进对话并开启个性化的智能会话。

    为免你们觉得我单独挑选了一个孤立的没有上下文的事件来抱怨机器人的不好的一面,下面我将展示我最近与谷歌助手交互的实例。最近一个朋友用Gmail给我发了一个在附近餐馆吃午饭的谷歌日程邀请。我早到了一会儿,通过使用我IPhone安装的谷歌地图导航到那个地方。为了打发时间,我站在餐馆面前,问谷歌助手,我在哪里,为什么我会在这。对于第一个问题,谷歌助手展示了地图,尽管很神奇的它不能准确的识别这个餐馆(这是一个带商场的)。让人震惊的是第二个问题,尽管我试着用多种方式提问(比如我正在跟谁见面)。

    很清楚的,谷歌助手没有集成谷歌自身有的其他服务;我已经允许所有谷歌服务询问的隐私要求,所以我猜想这些谷歌服务把我的所有数据保存在我的唯一识别下以方便利用。有可能这些行为已经得到改进了(我的这些经历是几个月前的了)。但是这只是一个表现集成不同的数据源重要性的例子,用来获取可以生成智能对话从而促进体验的上下文变量。讽刺的是,集成大量的不同数据源和之前的对话,将使得用户缩短与机器人的对话。从很多方面来说,这个很重要,尤其是对于商业应用,用户没有尝试与机器人进行一个长的会话。聊天机器人的目标就是产生足够的对话获取信息并执行必须的动作实现某些目标。

    Siri和谷歌助手是一个开放领域的机器人,有不受限制的上下文和词汇。所以,对于这些机器人来说障碍更大,不同于专用领域的单应用机器人具有受限制的上下文和词汇。但是,对数据源的数据融合的重要性对于两种机器人是一样的。数据融合可能看起来不想NLP和DL一样看起来好,但是也一样的重要对于机器人获取上下文从而与用户进行智能对话。识别所有相关数据的数据源,并且积极的使得它们可用是很重要的。之前的数据被用来与合适的上下文训练机器人。实时数据允许机器人更新属于当前对话上下文的数据变量。

    写到这里,读者也可以说些什么。分享你们与聊天机器人的故事。

    或者,告诉我哪里错了,我很期待在新年前夜立即使用这些nice的聊天机器人。

    加油,前进。虽然不喜欢这些聊天机器人,我将深入(研究)上下文。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值