【1】意图识别的难点:
- 输入不规范
- 多意图。eg:仙剑奇侠传 游戏?电视剧?小说?
- 结果的可靠性。
- 实效性: iPhone5 7月1日上市销售
6月30日的查询意图:新闻90%,百科10%
7月1日的查询意图:新闻70%,购买25%,百科5%
8月1日的查询意图:购买50%,资讯40%,其他10%
5年以后的查询意图:百科100%
【2】语义表示
- 分布语义表示(把语义表示成向量,word2vec等);基于harris分布假设:经常出现在类似上下文中的词具有相似性
- 模型语义表示:自然语言映射成逻辑表达式
- 框架语义表示:即现在用到的 domain;intent;之后基于规则的slots填充