Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x 对话管理Moodbot（2）

最新推荐文章于 2024-02-07 23:29:27 发布

StarSpaceNLP667

最新推荐文章于 2024-02-07 23:29:27 发布

阅读量295

点赞数

分类专栏： Transformer NLP StarSpace 文章标签：面试职场和发展 Rasa课程、培训、面试

本文链接：https://blog.csdn.net/StarSpaceNLP667/article/details/123059915

版权

本文深入探讨Rasa 3.x的对话管理，通过Moodbot示例展示策略机制。通过`rasa shell --debug`观察策略执行，了解`action_listen`等操作的重要性。文章强调了规则策略和记忆策略在不同对话阶段的作用，特别是当TED策略在无匹配规则时进行预测的情况。同时，讨论了如何利用规则更好地处理对话，如回退行为和单轮交互。文章最后介绍了Rasa源码学习课程，旨在帮助开发者深入理解Rasa的内部机制和设计选择。

摘要由CSDN通过智能技术生成

Rasa课程、Rasa培训、Rasa面试系列之： Rasa 3.x 对话管理Moodbot（2）

要查看Moodbot 策略机制在后台执行的操作，可以在本地运行“rasa shell--debug”。这将显示所有相关的调试信息，其中包括来自激活策略的信息。完整的日志显示的内容比在这里看到的要多得多，但是我们将重点放在总结上，以使事情更易于理解。这里的对话和以前一样，但现在附加了调试信息。

从图中可以看出：

在将控制权交还给用户之前，会触发一个“action_listen”。这是一个在shell中不直接可见的操作，但它仍然是一个非常重要的操作。在将控制权交还给用户之前，助理可能需要按顺序执行多个操作。这就是为什么在Rasa中“倾听”是一种明确的行为，需要由策略触发。
对话的不同部分由不同的策略机制处理。对于utter_iamabot`和 `utter_goodbye，我们有可以直接适用的规则。没有预定义的规则适用于“utter_greet”操作。而是由memorizationpolicy触发。
内存策略处理“utter_greet”动作，因为对话与“故事”中的所有故事在stories.yml遵循相同的模式。

让我们看看一个较长的会话。

你应该能够清楚这些规则是如何生成的。由于对话遵循的是一个示例故事，所以我们可以主要依赖于memorizationpolicy，但“bye”由RulePolicy处理，因为我们有一个规则。

触发TED

在前两个例子中，我们没有看到TED被触发。现在让我们试着用一些非常出乎意料的话来迫使他们这么做，比如当机器人问我们做得怎么样时，回答“不”。

TED之所以会被触发“utter_greet”动作，是因为在谈话的那一刻，所有的规则都不匹配，记忆的故事也不适用。这意味着 TED需要尝试预测下一个最佳行动。但不幸的是，没有任何训练数据可以帮助算法理解在这种情况下应该做什么，因为以前从未发生过类似的会话。请记住，你的故事被用作TED的训练数据。moodbot只有三个故事，没有一个看起来像这样的对话。所以当 TED在这里做预测时，它的置信度非常低。

我们可以配置 config.yml 会更恰当地处理这些情况。

“RulePolicy”可以配置为如果没有一个策略能够做出可信的预测，则返回到特定的操作。此设置默认为“打开”，您可以指定置信阈值以及需要触发的操作。假设你已经在你的领域里定义了一个“utter_rephrase”，domain.yml虚拟助理在重新训练后将使用不同的路径；

我们刚刚展示了几个策略机制如何协同工作的例子。但你可能仍然想知道“为什么”它是这样设计的。为了帮助解释所做的设计选择，让我们考虑一个您可能希望此助理能够处理的更高级对话。

作为一个实验，让我们考虑用故事来创建这个助理。这意味着我们只有内存策略和TED政策听候我们的安排。假设您的训练数据中有大量的示例故事，那么使用这种方法肯定可以走得更远。但你的训练数据不可能涵盖所有可能的对话组合。作为一个例子；想想上面对话中用户可能会问“你是机器人吗？”。

我们的助理总是能够正确回答这个问题，这对我们很重要。但是为了确保内存策略，我们可能需要创造很多故事，这不实际。我们的TED策略被设计来解开复杂的对话。这里的问题仅仅是一个单轮的互动。我们可以改进训练数据，使TED能够进行正确的推理，但如果我们引入另一个概念，也许会更实际一些。比我们的故事更高层次的东西。它将允许我们定义在特定的单轮交互中需要发生什么，如果我们看到`challenge_bot’的意图，只有一个适当的回应”。

我们需要的是“规则”，规则使我们很容易思考我们应该如何处理对话中的具体情况，它们使我们能够更直接地控制对话。但规则不能解决所有问题，如果你要用规则做任何事情，你需要精确地定义用户可能拥有的每一个可能的交互。这将很快变得无法维护，主要是因为您需要跟踪所有不同的排列。按照设计，Rasa只允许你为短篇对话编写规则。这是为了防止您创建不可维护状态机。规则的目标是为您提供另一种自定义助理处理对话的方式。它不是用来代替故事的。

规则的常见用例包括：

控制回退行为：可以将规则与回退分类器定制当NLU模型对他们的预测不自信时会发生什么。
单轮互动：如果你想在单回合互动中保证一个特定的结果，那么规则是一个非常方便的工具。你可能会遇到这样一种情况：即使你没有完美的故事，也很容易定义正确的行为。
表单：用户在表单中提供的信息需要谨慎处理。如何启动、提交、停用或检查表单是可以使用规则和自定义操作显式自定义的。

在这篇博文中，我们回顾了Rasa内部不同的策略机制是如何相互作用的，以及这些机制在设计会话助理时是如何发挥作用的。每个策略都允许您针对一个用例进行定制，但是没有一个策略适合每个场景。引入RulePolicy是因为它使在虚拟助理中实现特定任务更容易。规则是在故事之前考虑的，因此你可以明确地把谈话引向适当的方向。

Rasa官网链接：