Solr
文章平均质量分 85
Solr
一个技术渣渣
这个作者很懒,什么都没留下…
展开
-
solr配置文件schema.xml解析
schema.xml,主要定义索引的字段和字段类型 略...<!-- schema.xml位于solr/conf/目录下,类似于数据表配置文件 有关如何根据需要定制化该文件,请参照:http://wiki.apache.org/solr/SchemaXml 性能须知: 这里包含了很多实际应用不需要的可选项。 为改善性能,你可以: - 尽量将所有仅用于搜索,而不用于原创 2015-11-05 23:03:32 · 702 阅读 · 0 评论 -
Solr Facet的应用
Facet是Solr的高级搜索功能之一,Solr作者给出的定义是导航(Guided Navigation)、参数化查询(Paramatic Search)。Facet的主要好处是在搜索的同时,可以按照Facet条件进行分组统计,给出导航信息,改善搜索体验。Facet搜索主要分为以下几类:1. Field Facet搜索结果按照Facet的字段分组并统计,Facet字段通过在请求中加入”原创 2015-12-31 15:13:35 · 2270 阅读 · 0 评论 -
Solr自动生成ID配置
Solr基于Lucene的索引,而索引中的最基本的单元式Document,在Solr中,管理每一个Document(更新、删除、查询),基本都会用到对应的ID,类似关系数据表中的主键。但是,如果我希望Solr能够自动生成这个唯一的ID,有时候也省去了不少的工作,而只需要在Solr中进行配置即可。下面,通过实例来说明,如何配置Solr支持的UUID。在Solr中配置生成唯一U原创 2016-04-24 19:55:42 · 2754 阅读 · 0 评论 -
Solr Query
一.Query参数1.CoreQueryParam查询的参数1)q:查询字符串,必须的。2)q.op:覆盖schema.xml的defaultOperator(有空格时用"AND"还是用"OR"操作逻辑),一般默认指定。3)df:默认的查询字段,一般默认指定。4)qt:querytype,指定查询使用的QueryHandler,默认为“stan原创 2015-12-31 17:42:30 · 3035 阅读 · 0 评论 -
Solr空间搜索
空间搜索原理空间搜索,又名Spatial Search,基于空间搜索技术,可以做到:1)对Point(经纬度)和其他的几何图形建索引2)根据距离排序3)根据矩形,圆形或者其他的几何形状过滤搜索结果在Solr中,空间搜索主要基于GeoHash和Cartesian Tiers 2个概念来实现:GeoHash算法通过GeoHash算法,可以将经纬度的二维坐标变成一个可排序、可...原创 2015-11-08 11:21:52 · 2486 阅读 · 0 评论 -
Solr hightlight高亮显示
第一种方式是solrj操作:?1234567891011121314151617181920212223242526272829原创 2015-12-31 17:05:48 · 1200 阅读 · 0 评论 -
solr开发之拼写检查spellcheck
首先,修改schema.xml,增加需要检查的字段 <tokenizer class="org.ansj.solr5.AnsjTokenizerFactory" query="false" pstemming="true" stopwordsDir="stopwords/stopwords.dic"/> <filter cla原创 2015-11-08 00:00:24 · 3782 阅读 · 0 评论 -
Solr group分组查询
如:http://localhost:8080/solr/test_core/select?q=*:*&wt=json&indent=true&group=true&group.field=field&group.limit=0参数说明param nameparam valuedescription原创 2015-12-31 16:15:03 · 3553 阅读 · 0 评论 -
利用Ansj中文分词工具对段落进行切词
对于切词确实是一个复杂的功能,足以写上好几篇论文,但是如果仅仅想对一个句子、一个段落、一篇文章进行切词,可以利用中国自然语言开源组织中各位大牛写好的工具。已经打包成jar包,可以直接调用了,无须自己再考虑复杂的算法。当然这种切词是对于自然语言的,对于一些有规律的字符串,请自行利用indexOf、substring、split的各类Java自带函数,没有使用额外java包的必要。首先转载 2015-12-29 15:05:26 · 2182 阅读 · 0 评论 -
solr索引主从同步
solr索引同步的是core对core,以core为基本同步单元一个solr instance可以装载多个core,每个core拥有不同的schema,core与实例的关系等同于mysql中table和database的关系不支持直接同步实例假设我们已经在 192.168.1.10和192.168.1.20 两台服务器上部署了solr服务,192.168.1.10作为master,192.原创 2015-12-29 14:41:22 · 1461 阅读 · 0 评论 -
solr5.3环境搭建
最近公司要做搜索的项目,需要用到solr,今天就简单看了下solr的相关知识,搭建了solr环境。 solr的运行环境非常简单,只需要JDK和一个WEB容器即可,这里用到tomcat jdk和tomcat的配置在这里就不讲了,很简单。1、直接进入主题,网上先下载solr5.3的包并解压为solr-5.3.02、将solr部署到tomcat中,将E:\solr-5原创 2015-09-22 23:16:57 · 3558 阅读 · 4 评论 -
全文检索引擎Solr系列—–全文检索基本原理
场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从头至尾地扫描,直到找到“坑爹”二字为止。这种搜索方法叫做顺序扫描法。对于少量的数据,使用顺序扫描是够用的。但是妈妈叫你查出坑爹的“坑”字在哪一页时,你要是从第一页的第一个字逐个的扫描下去,那你真的是被坑了。此时你就需要用到索引。索引记录了“坑”字在哪一页,你转载 2015-11-07 23:11:18 · 541 阅读 · 0 评论 -
solr配置文件solrconfig.xml解析
solrconfig.xml配置文件主要定义了SOLR的一些处理规则,包括索引数据的存放位置,更新,删除,查询的一些规则配置。下面将对solrconfig进行详细描述:1 4.8 表示solr底层使用的是lucene4.82 <lib dir="../../../contrib/extraction/lib" regex=".*\.jar" /> 表示solr引用包的位置,当dir原创 2015-11-05 23:23:45 · 1461 阅读 · 0 评论 -
spring3.0定时任务+Solr数据导入
上一篇文章写到使用java定时任务,其实,spring也实现了定时任务,使用也很简单,下面来学习一下。 Spring3.0以后自主开发的定时任务工具,spring task,可以将它比作一个轻量级的Quartz,而且使用起来很简单,除spring相关的包外不需要额外的包,而且支持注解和配置文件两种。配置文件:applicationContext-schedual.xml...原创 2015-11-08 22:56:03 · 489 阅读 · 0 评论