自然语言理解中的意图识别

概念通过分类的方式将句子(query)划分到相应的意图种类当中,判断其属于哪个领域的问题。意图识别的方法基于词典以及模版的规则方法不同的意图会有不同的领域词典 ,比如书名、歌曲名、商品名等。根据用户的意图和词典的匹配程度或者重合程度来进行判断。基于机器学习模型对用户意图进行判别通过机器学习和深度学习的方法,对已经标注好的领域语料进行训练学习,得到意图识别的模型。在经过测试集得到语料对应的分类。fastText快速文本分类模型1.快速训练和预测,适合用于工业界2.重要的优化:层序遍历和
摘要由CSDN通过智能技术生成

概念

通过分类的方式将句子(query)划分到相应的意图种类当中,判断其属于哪个领域的问题。

意图识别的方法

  1. 基于词典以及模版的规则方法
    不同的意图会有不同的领域词典 ,比如书名、歌曲名、商品名等。根据用户的意图和词典的匹配程度或者重合程度来进行判断。
  2. 基于机器学习模型对用户意图进行判别
    通过机器学习和深度学习的方法,对已经标注好的领域语料进行训练学习,得到意图识别的模型。在经过测试集得到语料对应的分类。

fastText

快速文本分类模型
1.快速训练和预测,适合用于工业界
2.重要的优化:层序遍历和N-gram特征
在这里插入图片描述
输入的是:句子的n-gram的词向量
中间层:词向量和的平均值(特征)
输出:每个类别的概率,最大的概率就是该句子的类别

【注】
N-gram特征分为字粒度的n-gram和词粒度的n-gram

我喜欢白色的纯种萨摩耶

字粒度(2-gram)
我喜 喜欢 欢白 白色 色的 的纯 纯种 种萨 萨摩 摩耶
词粒度(2-gram)
我/喜欢 喜欢/白色 白色/的 的/纯种 纯种/萨摩耶

架构

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值