1. solr建索引时,schema.xml 中field定义跟 xml数据文件定义的不一致,导致对应域没有被索引。
schema.xml中:
<field name="tag" type="text_cn" indexed="true" stored="true"/>
xml数据文件中:
<field name="tags">xxxxx</field>
2. 繁简体转换 Myzhcoder.jar 的问题
修改过里面的txt文件。
3. maxFieldLength 当遇到内容非常长的文章时,用来限定内容的长度。
lucene2: 升级前限定的是10000
lucene5:不再限定
lucene2修改为:indexWriter.setMaxFieldLength(Integer.MAX_VALUE); 分词后的结果跟lucene5一致。
4. 排序问题 打印评分发现spanNearQuery 没有命中 分词位置信息有误
修改 tokenizer后位置信息正确。
5. 数字范围查询,性能比lucene2提升很多。 尤其是query查询关键词命中的结果很多的时候,fiter的效果明显。