查询关键字理解的难度

  1. 简单说明
    查询关键字,即通过搜索引擎,填入到搜索框中的内容,不限于百度,微信搜一搜,美团,微博等站内搜索。
    也可以称之为query。

  2. 用户意图识别方面:
    爱情公寓资源 – 重点是资源
    医生表情包 – 重点是表情包
    怎么恢复聊天记录 – 和健康无关
    华侨城集团招聘 – 和旅游无关
    烧烤店爆炸 – 重点是爆炸
    面朝大海、春暖花开 – 和旅游无关
    “宝宝”的query 大概率被分成母婴类

  3. query大部分都是短文本,信息量少并且存在较多的歧义性。
    2.1 错别字
    刘德花 和 刘德华 的错别字
    蚊帐的失恋33天在线观看 中的 “蚊帐” 和 文章
    2.2 权重配比
    蚊帐的失恋33天在线观看 重点在“失恋33天”,还是在“在线观看”
    2.3 一词多义
    苹果现在的价格 是苹果手机还是水果苹果
    2.4 多词一义
    北大和北京大学

  4. 评测问题
    3.1 query所返回的文档如何保证精度,召回
    3.2 返回的文档如何进行排序

学习资料推荐:
query理解,理解的是什么

搜索系统的架构设计

搜索query理解的架构设计

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值