rasa算法_基于rasa_nlu 模块的多意图识别

本文介绍了如何利用rasa_nlu的pipeline和tensorflow解决机器理解和多意图识别的问题。通过配置intent_featurizer_count_vectors和intent_classifier_tensorflow_embedding组件,结合intent_tokenization_flag和intent_split_symbol参数,训练模型能够识别用户输入的多个意图。数据格式和模型训练、测试过程也进行了展示。
摘要由CSDN通过智能技术生成

什么是nlu?

即自然语言理解(Natural Language Understanding),wiki中解释为 deals with machine reading comprehension。(◔◡◔)

jieba+mitie+sklearn 的不足之处:

1.官方文档mitie训练建议所需内存128G

2.针对用户所说的一句话存在多个意图,无法识别

基于tensorflow的pipeline尝试解决以上两个问题。这里pipeline定义的是如何解析用户的输入,分词(符号化),以及特征提取的方式。pipeline:定义如下

pipeline:

- name: "intent_featurizer_count_vectors"

- name: "intent_classifier_tensorflow_embedding"

intent_tokenization_flag: true

intent_split_symbol: "+"

intent_featurizer_count_vectors:用于特征提取

intent_classifier_tensorflow_embedding:采用tensorflow做意图分类

intent_tokenization_flag: true:告诉模型这是多意图,需要根据占位符进行意图切分

intent_split_symbol: "+" 多意图间按“+”切分

准备训练数据:

数据格式如下:

## intent: meetup

- I am new to t

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值