rasa学习笔记(nlu管道部分)

Rasa NLU负责意图提取实体提取。例如,输入“明天上海的天气如何?”,Rasa NLU要提取出改句子的意图是查询天气,以及对应的实体值和类型名:明天日期、上海城市。        Rasa NLU使用有监督算法来完成功能,因此需要开发者提供适当数量的语料,包括意图信息和实体信息。


Rasa NLU在软件架构上设计的很灵活,允许开发者使用各种算法来完成功能,这些算法的具体实现被称为组件(component)。为了让组件灵活配置和维持正确的前后组件的依赖关系,Rasa NLU引入了有向无环图DAG的组件配置系统。

1、语言模型组件:加载模型文件,为后续组件提供框架支持,如初始化spaCyBERT

2、分词组件:将文本分割成词,为后续的高级NLP任务提供基础数据;

3、特征提取组件:提取词语序列的文本特征,可以同时使用多个特征提取组件;

4NER组件:根据前面提供的特征对文本进行命名实体识别;

5、意图分类组件:按照语义对文本进行意图的分类,也成意图识别组件;

6、结构化输出组件:将预测结果整理成结构化数据并输出。这一部分不是以组件的形式提供的,而是流水线内建的功能,开发者不可见。

nlu.yml Rasa NLU的数据文件。包括意图字段和对应的例子。

Rasa NLU的训练数据为yaml格式。从结构上说,训练数据都在键(key)为nlu的列表内。列表中每个元素都是一个字典,依靠字典中的键来区分功能。具有特殊含义的键有 intentsynonym(同义词字段)、regex(正则表达式字段)lookup(查找表字段)。除intent外,其他3个都是可选的。

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值