solr入门之参考淘宝搜索提示功能优化拼音加汉字搜索功能

最新推荐文章于 2022-09-06 11:40:10 发布

permike

最新推荐文章于 2022-09-06 11:40:10 发布

阅读量1.4k

点赞数

分类专栏：搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/permike/article/details/54929480

版权

搜索引擎专栏收录该内容

3 篇文章 0 订阅

订阅专栏

http://blog.csdn.net/sqh201030412/article/details/51211551

首先看一下从淘宝输入搜索关键字获取到的一些数据信息:

第一张:使用拼音的全程来查询

可以看到提示的是匹配的转换的拼音的方式,看最后一个提示项

这里还有一个在指定分类目录下搜索的功能,难道后台还存储的类目的信息?

还有一个标签的信息要存储

第二使用首字母来匹配这里看不出来淘宝的东西太多了,首字母直接有了对应的全程

第三使用切断字母的匹配看的出来走的还是完全匹配的路径

第四使用汉字匹配的方法 : 这个没得说的这是主功能了

第五使用拼音加汉字的方式: 能够匹配到使用全部的拼音时这里能看出来是使用了转换的方法了

先将汉字转为拼音在去匹配

第六这里使用部分这个没啥问题转成拼音后 shouta*

第七这里应该是先转成拼音为 stao 看下面一张图搜索结果是吻合的,但是结果太少了,

这里淘宝因该使用了另外的搜索机制了.如果这种方法搜索到的数量不够,那么就使用查询模式

即再放一个分词的字段用来查询, 我想是分成一个一个的模式也就是搜索 s 套了

这里不需要考虑顺序了词中含有这两个就可以了就是下面的结果了

这里和上面说的是一个道理从这里大家应按能猜出来搜索shtao是没有结果的,可以验证下如果有兴趣

这里看到没有提示结果,就是没有了

按照猜测出来的两种搜索方式

淘宝处理

对于拼音加汉字问题应该是使用了双重查询 ,保证汉字是正确匹配的(应该使用的是当个分词字段)

然后再进行汉字转为拼音后的过滤,

学到一点解决拼音加汉字搜索建议的解决方法

新添加一个字段使用完全分词模式即分成一个一个用来做汉字匹配过滤查询

然后再用汉字转拼音查询当数量不够时再使用一次检索查询含有关键字即可不要求位置在首位

下面是自己的搜索建议改造拼音加汉字的改写

1.添加一个汉字单个分词的字段

schema.xml中配置

<fieldtype name="ng1_1" class="solr.TextField" positionIncrementGap="100">

<analyzer>

<tokenizer class="solr.NGramTokenizerFactory" minGramSize="1" maxGramSize="1"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

</fieldtype>

<field name="word_n1" type="ng1_1" indexed="true" stored="false"/>

<copyField source="word" dest="word_n1"/>

2.代码中添加过滤部分

//这里添加过滤--要包含的汉字--使用filter增加查询速度

if(StringFilterUtils.filterAll(q)!=null && StringFilterUtils.filterAll(q).trim().length()>0){

query.set(CommonParams.FQ, BaseSuggestIndex.Fd.word_n1.name()+":"+StringFilterUtils.filterAll(q).trim());

}

对比搜索条件

未优化前

优化后

可以发现汉字输入不正确,就不能出来提示了下面是一些输入正确的出来的结果

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。