solr
文章平均质量分 50
KingBoxing
平凡普通
展开
-
solr5解决时区差8小时的问题
在oschina上的第一篇文章,记录一个在工作中遇到的问题问题很简单,也算是开博了在solr5中解决时区的问题,更加简单了,直接修改配置文件bin/solr.in.sh即可。如下: #SOLR_TIMEZONE="UTC" 将此参数修改为如下: SOLR_TIMEZONE="UTC+8"转载 2015-07-31 10:22:20 · 6264 阅读 · 2 评论 -
solr 使用自定义的 QueryParser
版权信息: 可以任意转载, 转载时请务必以超链接形式标明文章原文出处, 即下面的声明.原文出处:http://blog.chenlb.com/2009/02/use-custom-solr-queryparser.html如果想让 solr 有更加强大的功能或在查询时做一些特别的处理。可以在 solrconfig.xml 里注册自定义的 QueryParser(查询解析转载 2015-09-17 01:10:28 · 1680 阅读 · 0 评论 -
Solr 使用自定义 Query Parser
版权信息: 可以任意转载, 转载时请务必以超链接形式标明文章原文出处, 即下面的声明.原文出处:http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html由于 Solr 默认的 Query Parser 生成的 Query 一般是 “短语查询”,导致只有很精确的结果才被搜索出来。大部分时候我们要分词后转载 2015-09-17 01:11:40 · 2516 阅读 · 0 评论 -
Solr Multivalue field的索引和搜索
Solr里头可以设计Field为Multivalue类型,这样的一个好处是可以很方便的设置copyField,在我们的项目中也有使用。但是一直以来都有一个问题困扰着我,就是对multivalue里头多个值域的搜索问题。多个value之间我认为应该是保持相互独立的,但是在实际搜索中感觉solr把所有的值域都串在一起,当作一个长value来处理,没有达到我想要的效果。后来通过搜索,我发现sol转载 2015-09-17 11:29:14 · 2769 阅读 · 0 评论 -
[ lucene扩展 ] spellChecker原理分析
spellChecker是用来对用户输入的“检索内容”进行校正,例如百度上搜索“麻辣将”,他的提示如下图所示: 我们首先借用lucene简单实现该功能。本文内容如下(简单实现、原理简介、现有问题) lucene中spellchecker简述lucene 的扩展包中包含了spellchecker,利用它我们可以方便的实现拼写检查的功能,但转载 2015-09-17 11:04:14 · 1614 阅读 · 0 评论 -
solr HMMChineseTokenizer 中文解词
solr自带的中文解词HMMChineseTokenizer的效果还不错,在schema.xml里面的配置如下 words="/data/local/solr-5.2.1/server/solr/solr_analyzer_task/dic/stopwords.txt"/>原创 2015-09-16 17:04:41 · 3228 阅读 · 0 评论 -
Solr4.2.1 拼写检查组件
在做搜索时一般可以在用户输入检索条件时使用suggest,而在点击完搜索时,使用拼写检查,二者结合给可以用户带来比较好的用户体验! suggest与spellcheck看似功能一样,出发点是不一样的,使用条件也不一样,spellcheck是在没有搜索出结果时才有的功能,搜索词正确是没能spellcheck结果的,而suggest是任何情况下都有结果的。Solr4.0以后又新增了一个拼写转载 2015-09-10 21:24:15 · 542 阅读 · 0 评论 -
Solr配置停止词/排除词 stopwords(mmseg版)
停止词是无功能意义的词,比如is 、a 、are 、”的”,“得”,“我” 等,这些词会在句子中多次出现却无意义,所以在分词的时候需要把这些词过滤掉。测试于:Solr 4.5.1, mmseg4j 1.9.1, Jdk 1.6.0_45, Tomcat 6.0.37 | CentOS 5.7我这里拿名为test的core做例子。准备停止词在solr home下建dic目录,转载 2015-08-17 15:35:56 · 4099 阅读 · 0 评论 -
Schema.xml和solrconfig.xml属性分析
现在我们开始研究载入的数据部分(importing data) 在正式开始前,我们先介绍一个存储了大量音乐媒体的网站http://musicbrainz.org ,这里的数据都是免费的,一个大型开放社区提供。MusicBrainz每天都提供一个数据快照(snapshot)的SQL文件,这些数据可以被导入PostgreSQL数据库中。 一、字段配置(s转载 2015-07-24 11:04:41 · 630 阅读 · 0 评论 -
Solr查询时设置字段的boost值,改变默认打分排序
实现方法有3个:在建索引的时候设置boost,这个值会写入文件,建索引时有额外的性能开销;在查询的时候指定boost,这个值不会写入文件,查询时指定任意字段的boost值,适用与一个索引库的多种查询场景,但查询时有额外性能开销;(推想)前两者结合使用,如绝大多数都需要标题优先,那么建索引时可指定标题boost为2,其他场景可在查询时指定标题boost为0.5,中和建索引时的设置。这转载 2015-08-17 14:42:39 · 2837 阅读 · 1 评论 -
Solr查询语法总结-参数说明
1、常用查询参数说明 q - 查询字符串,必须的。 fl - 指定返回那些字段内容,用逗号或空格分隔多个。 start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。 rows - 指定返回结果最多有多少条记录,配合start来实现分页。 sort - 排序,格式:sort=+[,+]… 。示例:(inSto转载 2015-07-23 22:38:16 · 1687 阅读 · 0 评论 -
关于solr schema.xml 和solrconfig.xml的解释
一、字段配置(schema) schema.xml位于solr/conf/目录下,类似于数据表配置文件,定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。 1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。name:就是这个Fi转载 2015-07-23 16:13:59 · 638 阅读 · 0 评论 -
SOLR---Field、CopyField、DynamicField
上面一节乱七八槽的讲了一下FieldType。 其实你可以想的简单一点,FieldType就好像是我们在Java中自定义类型。Field: Field就是一个字段,定义一个Field很简单:[html] view plaincopyfield name="price" type="sfloat" indexe转载 2015-07-23 15:32:18 · 777 阅读 · 0 评论 -
Solr的一些查询参数
fl: 是逗号分隔的列表,用来指定文档结果中应返回的 Field 集。默认为 “*”,指所有的字段。defType: 指定query parser,常用defType=lucene, defType=dismax, defType=edismaxq: query。q.alt: 当q字段为空时,用于设置缺省的query,通常设置q.alt为*:*。qf: query转载 2015-08-14 22:19:46 · 656 阅读 · 0 评论 -
solr增量更新的字段
在配置增量更新时MySQL表里要有一个字段,update_time能让solr找到那些行是新增的,在配置文件里的SQL要加上条件where update_time > '${dih.last_index_time}'"update_time字段要是date类型,但是我们在设计表的时间该字段是long的时间戳。所以当我在进行增量更新时,被更新的总是全量。所以要把long类型转换成date类型才能原创 2015-07-31 14:40:47 · 2852 阅读 · 1 评论 -
solr配置自动增量更新
关于solr如何导入数据请参见:http://blog.csdn.net/xintongfei/article/details/19046575自动增量更新可定时将数据库中的数据导入到solr索引库中,并可定时重建索引库,合并小索引文件为大的索引文件。下面介绍如何配置solr自动更新。需要准备的jar包solr自带: apache-solr-data转载 2015-07-28 21:01:29 · 5680 阅读 · 3 评论 -
SOLR对多个(关联)表创建索引
一、无关联多表创建索引1.1数据库准备 首先在数据库创建一张表,本来有一个tuser表了,我又创建了一个role表,就两三个字段,没什么特殊的,然后在里面随便添加几条数据即可,看一下数据库:1.2data-config.xml 数据库创建完成之后就是修改data-config.xml文件了,因为数据库跟solr之间的关联主要就是建立在这个文件上面的,所以接下来就转载 2016-02-19 20:31:41 · 3652 阅读 · 0 评论