Gavin老师Transformer直播课感悟 - 基于Transformer的Rasa 3.x Internals解密之TED Policy源码剖析(十三)

本文深入解析Rasa框架中TEDPolicy组件,探讨Transformer在对话策略中的实现,包括输入向量构造、Transformer处理、相似度计算等,并介绍TEDPolicy、TED和RasaModelData类的关键功能。
摘要由CSDN通过智能技术生成

        本文继续围绕工业级业务对话平台和框架Rasa对DAG图中的核心组件TEDPolicy的源码进行解析。

一、TEDPolicy组件源码解析

        TEDPolicy组件使用了模型TED(Transformer Embedding Dialogue),TED架构由以下几个部分组成:

  1. 把用户输入(用户意图+实体),对话历史信息,对话session中保存状态信息的slots,Rasa active forms连接组合成一个input vector,传递给Transformer前面的embedding layer
  2. 通过embedding layer输入给Transformer进行处理
  3. 使用一个dense layer对Transformer的输出进行处理从而获得对话的embedding
  4. 使用一个dense layer对系统响应信息进行embedding处理
  5. 在对话embedding和系统响应信息embedding之间计算相似度,这一步是基于StarSpace提供的算法

另外在前面介绍Rasa3.0时提到了end-to-end learning的方式,如上面的DAG图所示,如果使用end-to-end learning的方式,则用户输入信息经过Featurizers组件(CountVectorFeaturizer1和CountVectorFeaturizer2)的处理后,会直接把输出的features传给TEDPolicy组件进行处理,在这种情况下,并没有使用另外一个核心组件DIETClassifier输出的intents和entities。

  1. 关于class “TEDPolicy”

TEDPolicy继承自Policy,而Policy是所有对话策略的父类,它实现了GraphComponent接口。

在Policy中定义的方法supported_data,在Policy的子类中可以根据需要进行重写,譬如需要支持rule data或者两种类型的data都需要支持:

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值