Gavin老师Transformer直播课感悟 - 基于Transformer的Rasa 3.x 内核解密之Rule-based Policies架构设计与源码解析(十八)

本文深入解析基于Transformer的Rasa 3.x中的Rule-based Policies架构,介绍其设计原理与源码。Rule Policy替代了Mapping、Fallback和Form Policy,用于处理固定响应和复杂对话场景。尽管rules在构建对话机器人中扮演重要角色,但不能完全替代机器学习策略,如TEDPolicy。Rasa 3.x中的RulePolicy基于训练数据中的rules进行预测,并提供了核心配置选项。此外,还讨论了InvalidRule异常类及其与MemoizationPolicy的关系。
摘要由CSDN通过智能技术生成

本文继续围绕工业级业务对话平台和框架Rasa对Rule-based Policies架构设计与源码进行解析。

一、关于Rule-based Policies架构设计与源码解析

  1. Rule Policy内部机制解析

       Rasa 2.0 引入了用于配置对话管理的Rule Policy,从而可以清晰地区分使用预定义逻辑来选择一个固定的response的policies和其它通过训练数据学习来预测对话机器人的next action的policies。通过Rule Policy机制可以移除在选择一个policy配置方面的猜测和使它更容易强化业务逻辑。

Rule Policy替换了原先出现在1.x 版本中的几种policies:

-Mapping Policy:如果一个具体的intent被探测到,那么会预测对应的action

-Fallback Policy:如果NLU的confidence值低于设定的threshold,那么会预测fallback response action

-Form Policy:如果一个form是active状态且form中所有的slots还没有被填充完整,那么会预测form action来请求下一个需要填充的slot

        Rules定义了某个条件被满足后需要采取的actions,适用于选择固定的response的对话场景,另外rules也可以被用于处理更复杂的场景,譬如在对话开始时运用rules,也可以在当一个slot被设置了特定值的时候运用rules,fallback和forms也可以通过rules来定义&#

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值