项目中用到了Solr 搭建检索,基础版本,正常使用,但是在检索的时候,偶尔在文本中出现了不是当前数据的一些其他的内容,找了下官网说明,具体不知为啥,只能看看源码。。。
经过debug 发现一个配置以前没有注意到maxAnalyzedChars
官网解释是标红分析的字符限制,默认值是51200。
但是这个参数值只能在solrconfig.xml 中配置,-1不限制大小,源码可查。
OK,再次检索大文本发现正常了。
最后说下发现的问题:
1.为什么会标红出问题。
在进行标红处理时候有一个分段的操作,如果超过了这个最大值,会进行截取操作,然后多余的字符会分到了下一条数据上???????还有这种操作。。。
2.其实很多时候官网都给出了各个字段配置,但是很多时候搞不懂这个配置具体是干啥的,这时候就需要试验了,多试试就出来了,想要知道为啥,就只有跟代码了。