rasa算法_基于rasa_nlu 模块的多意图识别

最新推荐文章于 2024-08-27 14:46:31 发布

weixin_39946500

最新推荐文章于 2024-08-27 14:46:31 发布

阅读量1.2k

点赞数

文章标签： rasa算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39946500/article/details/111927137

版权

本文介绍了如何利用rasa_nlu的pipeline和tensorflow解决机器理解和多意图识别的问题。通过配置intent_featurizer_count_vectors和intent_classifier_tensorflow_embedding组件，结合intent_tokenization_flag和intent_split_symbol参数，训练模型能够识别用户输入的多个意图。数据格式和模型训练、测试过程也进行了展示。

摘要由CSDN通过智能技术生成

什么是nlu？

即自然语言理解(Natural Language Understanding)，wiki中解释为 deals with machine reading comprehension。(◔◡◔)

jieba+mitie+sklearn 的不足之处：

1.官方文档mitie训练建议所需内存128G

2.针对用户所说的一句话存在多个意图，无法识别

基于tensorflow的pipeline尝试解决以上两个问题。这里pipeline定义的是如何解析用户的输入，分词(符号化)，以及特征提取的方式。pipeline：定义如下

pipeline:

- name: "intent_featurizer_count_vectors"

- name: "intent_classifier_tensorflow_embedding"

intent_tokenization_flag: true

intent_split_symbol: "+"

intent_featurizer_count_vectors：用于特征提取

intent_classifier_tensorflow_embedding：采用tensorflow做意图分类

intent_tokenization_flag: true：告诉模型这是多意图，需要根据占位符进行意图切分

intent_split_symbol: "+" 多意图间按“+”切分

准备训练数据：

数据格式如下：

## intent: meetup

- I am new to t

最低0.47元/天解锁文章

weixin_39946500

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。