自动补全_elasticsearch支持拼音自动补全

最新推荐文章于 2023-03-04 12:40:14 发布

XU美伢

最新推荐文章于 2023-03-04 12:40:14 发布

阅读量641

点赞数

文章标签：自动补全

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35811662/article/details/112702274

版权

最近要做一个自动补全搜索的项目，很久没看了，都生疏了，过年的时候也写过好几篇相关文章(见文末)，相比以前的自动补全，本次增加了两个新功能：

支持拼音全拼、拼音prefix补全
支持模糊自动补全

对于拼音，主要就是使用pinyin分词插件，具体的原理后续分享，本文的目的是说明如何进行拼音补全。

首先就是建模，如下图：

可以看出full_pinyin、prefix_pinyin这两个filter就是支持全拼、拼音prefix，加上standard标准分词的搜索，原理很简单，相当于一个词可以通过三种类型的分词进行匹配，增大了匹配范围。

其次如何补全呢？见下图：

可以看出最多会匹配三个suggest，虽然同时匹配的几率很小，但从程序的角度看，还是要处理排序问题，在本次项目中weight都相同的，排序完全基于匹配度。

这个排序已经不是ELK的问题了，只能应用去处理，每个suggest下的item有优先级，不同suggest又有优先级。目前想到的方法就是只要每种suggest存在，就先取top3，然后组合在一起，standard优先级>全拼>拼音prefix，接下去就是每个suggest的剩余部分组合在一起，最后排重相同ID的数据。

为什么这样排列优先级呢？主要考虑到补全精确性的情况，谁都希望standard的能先补全，而拼音prefix筛选出不相干的数据可能相对较多。

另外这图中也可以看出，这个例子支持一定的模糊匹配。

《elasticsearch自动补全优化》
《再论elasticsearch自动补全在实战中的优化》

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
自动补全_elasticsearch支持拼音自动补全

最近要做一个自动补全搜索的项目，很久没看了，都生疏了，过年的时候也写过好几篇相关文章(见文末)，相比以前的自动补全，本次增加了两个新功能：支持拼音全拼、拼音prefix补全支持模糊自动补全对于拼音，主要就是使用pinyin分词插件，具体的原理后续分享，本文的目的是说明如何进行拼音补全。首先就是建模，如下图：可以看出full_pinyin、prefix_pinyin这两个filter就是支...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。