搜索结果优化方案

  1. 同音字纠错:(权利的游戏->权力的游戏)
    1.1. 对《权利的游戏》做分词,变成“权利/的/游戏”,使用分词搜索,并对搜索结果进行评分排序
    1.2. 将分词“权力/的/游戏”进行同音词查找“quanli->{权力、权利、全力、圈里}”,再对同音词做搜索
    1.3. 对上面的结果做综合评分排序,给出恰当的结果列表
  2. 包含搜索:(平凡世界->平凡的世界)
    2.1 将《平凡世界》做分词“平凡/世界”,分别使用“平凡”、“世界”做搜索
    2.2 可以将多个分词的结果集取交集,全部hit的搜索结果权重最高
    2.3 同样也可以将同音字纠错的方案走一遍
  3. 语义搜索/别名搜索:(21天精通C+±>{21天学通C++、21天学会C、21天精通C}、史蒂芬->{史帝芬、施蒂芬、斯蒂芬})
    3.1 要构建一个同义词条库比如“精通->{学通、学会}”,当然这是一个全映射
    3.2 替换同义词后将分词再做分词查询、评分排序等
    先直接进行一次搜索,如果直接hit那么就将此结果作为第一个结果,然后再用同音字纠错、包含搜索、语义搜索的结果作为补充结果列表

我认为难点在于:

  1. 分词如何分的恰当
  2. 同音词库、同义词库的构建
  3. 如何对搜索结果进行评分排序(同音搜索、包含搜索、语义搜索会有多个结果集,不同的结果集的结果如何排序)
  4. 进行如此多维度的查询耗时如何
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值