Gavin老师Transformer直播课感悟 - 基于Transformer的Rasa 3.x Internals解密之DIET源码剖析(十二)

最新推荐文章于 2023-02-09 19:50:14 发布

m0_49380401

最新推荐文章于 2023-02-09 19:50:14 发布

阅读量993

点赞数 1

分类专栏： AI 文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49380401/article/details/122310923

版权

本文详细剖析了Rasa对话框架中的核心组件DIETClassifier，该组件结合Transformer进行意图识别和实体提取。通过分析源码，解释了Transformer如何处理输入信息，以及DIETClassifier如何利用CRF进行损失计算。同时介绍了DIETClassifier、DIET、TransformerRasaModel和RasaModelData等相关类的功能和交互。

摘要由CSDN通过智能技术生成

本文继续围绕工业级业务对话平台和框架Rasa对DAG图中的核心组件DIETClassifier的源码进行解析，另外从Transformer的角度来解析意图分类任务和实体识别任务是如何实现的。

一、DIETClassifier组件源码解析

DIETClassifier的作用是完成意图识别和实体提取这两大任务。这个组件使用了模型DIET(Dual Intent and Entity Transformer)，意图识别和实体提取共享一个Transformer，Transformer通过注意力机制对输入信息进行编码处理，之后把输出的tokens传给CRF内部的前馈神经网络(CRF不同位置之间存在Transition Matrix，从而可以表达信息之间的关系)进行处理，CRF把处理结果与ground truth(正确的entity labels)进行比较，从而计算出Entity Loss。代表全局信息的token ”__CLS__”经过Transformer处理后的输出和intent labels被编码进同一个语义级别的向量空间(vector space)。通过计算loss来最大化与target label的相似度，而最小化负样本的相似度。

关于class “DIETClassifier”

DIETClassifier实现了GraphComponent接口，并继承自IntentClassifier和EntityExtractorMixin。

IntentClassifier目前没有具体实现，这是为了将来可以进行扩展：

EntityExtractorMixin提供了实体提取需要使用的一些公共的方法，譬如find_entity:等：

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。