原文:Query Intent Detection using Convolutional Neural Networks
主要贡献:
- 使用卷积神经网络来提取查询向量表示作为查询分类的特征
- 使用该特征来对查询意图分类
- 能有效地检测出查询意图,具有较高的查准率和查全率
导言
- 现代搜索引擎为了满足用户的搜索需求,需深入了解用户的查询,识别查询背后的意图。例如,查询“美国总统”将返回巴拉克奥巴马作为答案,查询“匹兹堡图片”将首先显示图像搜索引擎的结果。
- 查询意图识别的挑战性:查询通常很短;识别用户意图需更多的上下文而不只是关键字;意图分类的数量非常大。大多数方法都需要大量的人力来为每个意图类定义模式。
- 本方法是使用深度学习来对查询向量表示,然后将其用作特征来按意图对查询进行分类。
相关工作
两种主流方法来识别查询意图:
- 基于规则的方法:使用预定义的规则将新查询与其意图匹配,如果能匹配上则一定是精确的,但可能缺少相应规则而覆盖率低,规则需要大量人力来设计
- 基于统计的方法:监督或非监督学习,在监督方法中需要基于领域知识或特征工程
- 本文自动生成生成查询向量作为特征,而不需人工设计分类特征。
查询意图识别
本方法
本模型包括两个步骤:
- 离线时训练模型参数,利用标记了意图的查询样本学习卷积神经网络的参数和分类器
- 在线时在新查询上运行模型,得到其意图分类结果