Rasa课程、Rasa培训、Rasa面试系列之: Rasa 3.x 对话管理Moodbot(2)

本文深入探讨Rasa 3.x的对话管理,通过Moodbot示例展示策略机制。通过`rasa shell --debug`观察策略执行,了解`action_listen`等操作的重要性。文章强调了规则策略和记忆策略在不同对话阶段的作用,特别是当TED策略在无匹配规则时进行预测的情况。同时,讨论了如何利用规则更好地处理对话,如回退行为和单轮交互。文章最后介绍了Rasa源码学习课程,旨在帮助开发者深入理解Rasa的内部机制和设计选择。
摘要由CSDN通过智能技术生成

Rasa课程、Rasa培训、Rasa面试系列之: Rasa 3.x 对话管理Moodbot(2)

要查看Moodbot 策略机制在后台执行的操作,可以在本地运行“rasa shell--debug”。这将显示所有相关的调试信息,其中包括来自激活策略的信息。完整的日志显示的内容比在这里看到的要多得多,但是我们将重点放在总结上,以使事情更易于理解。这里的对话和以前一样,但现在附加了调试信息。

从图中可以看出:

  • 在将控制权交还给用户之前,会触发一个“action_listen”。这是一个在shell中不直接可见的操作,但它仍然是一个非常重要的操作。在将控制权交还给用户之前,助理可能需要按顺序执行多个操作。这就是为什么在Rasa中“倾听”是一种明确的行为,需要由策略触发。
  • 对话的不同部分由不同的策略机制处理。对于utter_iamabot`和 `utter_goodbye,我们有可以直接适用的规则。没有预定义的规则适用于“utter_greet”操作。而是由memorizationpolicy触发。
  • 内存策略处理“utter_greet”动作,因为对话与“故事”中的所有故事在stories.yml遵循相同的模式。

让我们看看一个较长的会话。

你应该能够清楚这些规则是如何生成的。由于对话遵循的是一个示例故事,所以我们可以主要依赖于memorizationpolicy,但“bye”由RulePolicy处理,因为我们有一个规则。

触发TED

在前两个例子中,我们没有看到TED被触发。现在让我们试着用一些非常出乎意料的话来迫使他们这么做,比如当机器人问我们做得怎么样时,回答“不”。

TED之所以会被触发“utter_greet”动作,是因为在谈话的那一刻,所有的规则都不匹配,记忆的故事也不适用。这意味着 TED需要尝试预测下一个最佳行动。但不幸的是, 没有任何训练数据可以帮助算法理解在这种情况下应该做什么,因为以前从未发生过类似的会话。请记住,你的故事被用作TED的训练数据。moodbot只有三个故事,没有一个看起来像这样的对话。所以当 TED在这里做预测时,它的置信度非常低。

我们可以配置 config.yml 会更恰当地处理这些情况。

“RulePolicy”可以配置为如果没有一个策略能够做出可信的预测,则返回到特定的操作。此设置默认为“打开”,您可以指定置信阈值以及需要触发的操作。假设你已经在你的领域里定义了一个“utter_rephrase”,domain.yml虚拟助理在重新训练后将使用不同的路径;

我们刚刚展示了几个策略机制如何协同工作的例子。但你可能仍然想知道“为什么”它是这样设计的。为了帮助解释所做的设计选择,让我们考虑一个您可能希望此助理能够处理的更高级对话。

作为一个实验,让我们考虑用故事来创建这个助理。这意味着我们只有内存策略和TED政策听候我们的安排。假设您的训练数据中有大量的示例故事,那么使用这种方法肯定可以走得更远。但你的训练数据不可能涵盖所有可能的对话组合。作为一个例子;想想上面对话中用户可能会问“你是机器人吗?”。

我们的助理总是能够正确回答这个问题,这对我们很重要。但是为了确保内存策略,我们可能需要创造很多故事,这不实际。我们的TED策略 被设计来解开复杂的对话。这里的问题仅仅是一个单轮的互动 。 我们可以改进训练数据,使TED能够进行正确的推理,但如果我们引入另一个概念,也许会更实际一些。比我们的故事更高层次的东西。它将允许我们定义在特定的单轮交互中需要发生什么,如果我们看到`challenge_bot’的意图,只有一个适当的回应”。

我们需要的是“规则”,规则使我们很容易思考我们应该如何处理对话中的具体情况,它们使我们能够更直接地控制对话。但规则不能解决所有问题,如果你要用规则做任何事情,你需要精确地定义用户可能拥有的每一个可能的交互。这将很快变得无法维护,主要是因为您需要跟踪所有不同的排列。按照设计,Rasa只允许你为短篇对话编写规则。这是为了防止您创建不可维护状态机。规则的目标是为您提供另一种自定义助理处理对话的方式。它不是用来代替故事的。

规则的常见用例包括:

  • 控制回退行为:可以将规则与回退分类器定制当NLU模型对他们的预测不自信时会发生什么。
  • 单轮互动:如果你想在单回合互动中保证一个特定的结果,那么规则是一个非常方便的工具。你可能会遇到这样一种情况:即使你没有完美的故事,也很容易定义正确的行为。
  • 表单:用户在表单中提供的信息需要谨慎处理。如何启动、提交、停用或检查表单是可以使用规则和自定义操作显式自定义的。

在这篇博文中,我们回顾了Rasa内部不同的策略机制是如何相互作用的,以及这些机制在设计会话助理时是如何发挥作用的。每个策略都允许您针对一个用例进行定制,但是没有一个策略适合每个场景。引入RulePolicy是因为它使在虚拟助理中实现特定任务更容易。规则是在故事之前考虑的,因此你可以明确地把谈话引向适当的方向。

Rasa官网链接: 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值