Solr中文字段的查询与字段分词后如何聚合查询的问题

最新推荐文章于 2024-04-27 00:45:56 发布

长沙周杰伦

最新推荐文章于 2024-04-27 00:45:56 发布

阅读量5k

点赞数

分类专栏： solr 文章标签： solr 聚合查询中文字段分词

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuqinshouss/article/details/76599129

版权

问题描述：

问题一：

比如数据里面有个叫name的字段，存储的是用户名，如果name字段使用的fieldType配置了英文分词，那么我们对于这个字段的查询结果会有错误。比如，查询“张三”，那么像“张”、“三哥”、“张一三”等数据都会被查出来，含有“张”或者“三”的数据都会被查出来，也就是说，配置了英文分词的，对中文默认会是按字分词，并且只要满足一个字就会被匹配上。

问题二：

在对某个使用配置了分词的fieldType的中文字段进行聚合查询的的时候，会按照分词的方式进行聚合，而不是一个字段作为一个整体进行聚合。比如字段内容为：“中国人民”，配置英文分词，没有配置中文分词的，将会按字分词，会按“中”、“华”、“人”、“民”去聚合，配置了中文分词的，有可能会按照“中国”、“人民”去进行聚合，而我们想要的结果是整个字段去进行聚合，所以这都不符合我们的要求。

解决办法：

这两个问题其实是一个问题，solr字段中文分词的问题。针对这个问题有一下两个办法：

（1）、对于中文字段，使用solr定义好了的没有配置英文分词的fieldType，比如string等，而不要用像text_general进行了英文分词的fieldType，这样对对中文就会是一个字段看做一个整体。查询也不会出现错乱，也可用通配符。

（2）、对我们将要包含

最低0.47元/天解锁文章

长沙周杰伦

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Solr中文字段的查询与字段分词后如何聚合查询的问题

问题描述：问题一：比如数据里面有个叫name的字段，存储的是用户名，如果name字段使用的fieldType配置了英文分词，那么我们对于这个字段的查询结果会有错误。比如，查询“张三”，那么像“张”、“三哥”、“张一三”等数据都会被查出来，含有“张”或者“三”的数据都会被查出来，也就是说，配置了英文分词的，对中文默认会是按字分词，并且只要满足一个字就会被匹配上。问题二：在对某个使用
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。