Gavin老师Transformer直播课感悟 - 基于Transformer的Rasa 3.x 内核解密之UnexpecTEDIntentPolicy算法源码及IntentTED详解(十六)

最新推荐文章于 2024-10-16 00:00:43 发布

m0_49380401

最新推荐文章于 2024-10-16 00:00:43 发布

阅读量522

点赞数 1

分类专栏： AI 文章标签： transformer 算法深度学习

本文链接：https://blog.csdn.net/m0_49380401/article/details/122443083

版权

AI 专栏收录该内容

165 篇文章 12 订阅

订阅专栏

本文继续围绕工业级业务对话平台和框架Rasa对如何处理业务对话系统中来自用户的unexpected intent的场景从核心组件UnexpecTEDIntentPolicy的源码层面进行解析。

一、关于UnexpecTEDIntentPolicy组件算法源码分析

UnexpecTEDIntentPolicy源码分析

Rasa 3.x把所有的组件都抽象为graph component，并构建出各个graph component之间的依赖关系，这种依赖关系可以表达数据的生产者和消费者模型，Rasa 3.x基于DAG图的架构实现了系统基础架构和模型架构的分离，这样就可以使开发者只考虑在graph中使用什么样的模型，譬如通过下面的方法来指定UnexpecTEDIntentPolicy组件所使用的模型IntentTED，它会负责对数据进行处理：

通过方法run_training把输入数据转换为模型需要的特征数据vectors：

参数说明：

model_data：转换后的特征数据vectors

label_ids：与model_data里的数据相对应，如果为空，则会抛出RasaCoreException，因为模型在post training时会使用这些ids进行比较

在方法run_training内部会调用父类(TEDPolicy)的方法run_training：

然后会调用关键方法fit，这实际上是调用tensorflow的Keras model的fit方法：

在UnexpecTEDIntentPolicy的方法run_training里还调用了方法compute_label_quantiles_post_training，这个方法用于计算是否触发” action_unlikely_intent”的分数，在推理时针对每一个label都会计算多个分数，再根据” tolerance”设定的值来决定触发action ” action_unlikely_intent”的 threshold：

在这个方法里会调用IntentTED的核心方法run_bulk_inference，根据输入数据RasaModelData调用模型进行预测，在方法最后调用了RasaModel的方法run_inference：

在方法参数里，batch_size可以是int,也可以是一个List，方法返回类型是Dict。在方法里，调用了create_data_generators来获得data_generator，data_generator是由输入和输出构成的一个二元组，根据iter方法把data_generator转换为data_iterator。在while循环里，可以看到调用了next方法来获取一条数据，然后调用方法_rasa_predict进行预测。当遍历完数据后，会抛出异常StopIteration。根据batch_in产出每一条数据的batch_out后，需要调用方法_merge_batch_outputs进行合并。