![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
solr
maqianmaqian
这个作者很懒,什么都没留下…
展开
-
solr自定义评分器
solr服务搭建完成(索引已建立,可以进行搜索)现象: 搜索" 美女"后,“美女美女美女美女”文档会出现第一位。原因: 文档中关键词出现次数,默认的tf,即文档频率值就大,所以总是出现 在第一们。但实际系统中可能并不需要 这种结果 这个时候的解决办法:根据自己业务需要进行重写评分器 1. 自定义评分器 package cn.xxt.solr.util;...原创 2012-11-04 16:36:52 · 404 阅读 · 1 评论 -
solr高亮显示
solr 两个主要配置文件中. schema.xml 和 solrconfig.xml中 在solrconfig中 有 <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true"> <lst name="defaults">原创 2012-11-04 16:48:21 · 171 阅读 · 0 评论 -
solr中使用IKAnalysizer 基于配置的自定义词典扩充
基于配置的词典扩充IK 分词器还支持通过配置IKAnalyzer.cfg.xml 文件来扩充您的专有词典以及停止词典(过滤词典)。步骤如下: 1. 部署IKAnalyzer.cfg.xmlIKAnalyzer.cfg.xml 部署在代码根目录下( 对于web 项目, 通常是WEBINF/classes 目录)同hibernate、log4j 等配置文件相同。2. 词典...原创 2012-11-04 20:43:25 · 229 阅读 · 0 评论 -
solr schema.xml配置总结
schema.xml 在solr/conf/目录下,类似于数据表配置文件。 为了改进性能,可以采取以下几种措施:1. 将所有只用于搜索的,而不需要作为查询结果的field(特别是一些比较大的field)的stored设置为false。 2. 将不需要被用于搜索的,而只是作为查询结果返回的field的indexed设置为false。 3. 删除所有不必要...原创 2012-11-04 21:23:36 · 190 阅读 · 0 评论 -
solr 中文分词filedType定义
一. solr.TextField 允许用户通过 分析器 来定制 索引和查询 的 fieldType。分析器包括 一个分词器(tokenizer)和多个过滤器(filter)。代码展示: <fieldType name="text" class="solr.TextField" positionIncrementGap="100"> <an...原创 2012-11-05 11:52:12 · 157 阅读 · 0 评论 -
solr solrconfig.xml
一. DataDir 参数 <dataDir>/var/data/solr</dataDir> 不用 “Solr home”/data 目录,可以指定其它别的目录来存放所有索引数据。如果使用了 replication(主从复制),它可以匹配 replication 配置。如果这个目录不是绝对的,那会是当前 servlet...原创 2012-11-05 15:24:37 · 87 阅读 · 0 评论 -
solr检索运算符
1. “:” 指定字段查指定值,如返回所有值*:*2. “?” 表示单个任意字符的通配3. “*” 表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)4. AND +5. OR 空隔7. NOT、!、- (排除操作符不能单独与项使用构成查询)8. ( ) 用于构成子查询9. [] 包含范围检索,如检索某时间段记录,包含头尾,date:[200707 TO 20...原创 2012-11-07 11:50:15 · 189 阅读 · 0 评论 -
全文检索特珠字符过滤
现象: 在搜索处输入 2012~2013 ,搜索报错 解决办法: (1) 在StringUtil中添加 如下方法 /*** 过滤特殊字符* @param str* @return*/public static String replaceSpecialStr(String str) {if(isEmpty(str)) {return str...原创 2013-02-06 10:37:31 · 155 阅读 · 0 评论