solr
wzb56
never say die! never ever give up!
人活着,你也让别人活!
前半生不犹豫,后半生不后悔!
改变一生的无外乎两种东西:一是你读过的书,一是你遇到的人。
改变命运的无外乎两种东西:一是你读过的书,一是你遇到的人。
展开
-
使用solr搭建你的全文检索
使用solr搭建你的全文检索Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档:实战Lucene,第 1 部分: 初识 Lucene:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/用Lucene加速Web搜索应用程序的开发:http://w转载 2012-07-18 14:29:30 · 869 阅读 · 0 评论 -
Solr 4.0: Realtime GET
原文链接:Solr 4.0: Realtime GET 在即将到来的Solr 4.0中,"Realtime get"是我准备要研究的。它甚至允许你查看发送到Solr但还没被commit到索引文件的数据。下面让我们看一下它是如何运作的。 原理 原来Lucene/Solr中的更新操作有一个小问题:在你提交数据但是还没有执行commit命令时,它们是不能被访问的。原因在于comm转载 2012-08-15 20:20:41 · 1270 阅读 · 0 评论 -
Solrj操作Solr4.0 中CloudSolrServer的一般过程
Solrj操作Solr4.0 中CloudSolrServer的一般过程 一、准备工作:创建eclipse工程1. 下载solr4.0_src的源码包,解压后,进入目录中,在命令行执行:ant eclipse 则可以生成一个eclipse工程,会在目录中多了关于eclipse工程的文件:.classpath 和 .project;在eclipse导入该生成的工原创 2012-08-01 18:27:23 · 9917 阅读 · 5 评论 -
Solrj对SolrServer进行Term查询:(利用prefix 也可以实现auto-complete)
参考官方wiki:// 参考(refer to)http://wiki.apache.org/solr/TermsComponent主要结果类:TermsResponse, TermsResponse.Term;在solrconfig.xml中的相关设置: <!-- Terms Component http://wiki.apache.org/solr/Term原创 2012-08-17 16:24:23 · 4580 阅读 · 2 评论 -
solrj实现solr的group查询:
参考wiki:http://wiki.apache.org/solr/FieldCollapsing#Result_Grouping_.2BAC8_Field_Collapsing一、实现的相关类:SolrServer、SolrQuery、QueryResponse、GroupResponse、GroupCommand、Group、SolrDocumentList (1)原创 2012-08-16 20:14:49 · 8162 阅读 · 2 评论 -
solrj实现solr的suggestion(基于spellcheck)
参考wiki:http://wiki.apache.org/solr/Suggester/在solrconfig.xml中设置组件:添加suggest组件: suggest org.apache.solr.spelling.suggest.Suggester org.apache.solr.spelling.suggest.tst.TSTLoo原创 2012-08-16 19:38:52 · 6010 阅读 · 2 评论 -
solrj 查询SolrServer的一般流程
程序举例:package cn.wzb;/** * @author wang.zb */import org.apache.solr.client.solrj.SolrQuery;import org.apache.solr.client.solrj.SolrServer;import org.apache.solr.client.solrj.SolrServerExcept原创 2012-08-17 15:15:46 · 3217 阅读 · 2 评论 -
solr中同义词配置 (Synonyms)
1) 配置 ==========================schema.xml START=================================================^M ^M ^M转载 2012-08-16 19:28:56 · 6114 阅读 · 0 评论 -
中文分词:之Trie树
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。 在这里我想介绍一下中文分词的一个最基础算法:最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有两种:一种正向转载 2012-08-24 10:06:16 · 10515 阅读 · 0 评论 -
经纬度搜索(1)-Geohash算法原理
geohash作为Solr的位置信息搜索算法,有必要了解其基本的实现原理。geohash算法的wiki链接为http://en.wikipedia.org/wiki/Geohash,这里再结合自己的理解,重新复述一下。 由经纬度变成base32标识 geohash的思想,是将所有的经纬度坐标,通过geohash,变成一个唯一的base32标识。他将世界上的所有区域进行分块,每个维度都是转载 2012-08-15 19:59:48 · 1888 阅读 · 0 评论 -
Solr的自动完成/自动补充实现介绍(3)
原文URL:http://java.dzone.com/news/solr-and-autocomplete-part-3?mz=33057-solr_lucene 在之前的两个部分(part1、part2)中,我们学会了如何配置和查询solr来获取自动完成的功能。今天,我们来看一下如果为suggester添加字段,以这种方式来提供自动完成的功能。 组件配置 在上一期的配转载 2012-08-15 18:15:38 · 1647 阅读 · 0 评论 -
solr的schema.xml
<!-- Licensed to the Apache Software Foundation (ASF) under one or more contributor license agreements. See the NOTICE file distributed with this work for additional information regarding copyrigh原创 2012-08-03 10:16:51 · 1727 阅读 · 0 评论 -
Solr的分布式复制
SOLR复制模式,是一种在分布式环境下用于同步主从服务器的一种实现方式,因之前提到的基于rsync的SOLR不同方式部署成本过高,被SOLR1.4版本所替换,取而代之的就是基于HTTP协议的索引文件传输机制,该方式部署简单,只需配置一个文件即可。以下讲解具体操作步骤: 步骤分主服务器和从服务器,允许有多个从服务器,即从服务器的配置一样。主服务转载 2012-07-19 15:17:01 · 963 阅读 · 0 评论 -
SolrCloud概述
在Lucene/Solr的SVN trunk中的SolrCloud已经可用, 在即将发布的4.0版本中将正式包含. 目前SolrCloud已经成熟, 可以支持分布式索引和分布式搜索. 下面是我们一个项目采用新的SolrCloud的部署结构图: 看起来是否非常简单? 下面我们看看内部的一些实现细节. SolrCloud功能和架构 下面是SolrCloud一些不错的转载 2012-07-24 08:49:42 · 1894 阅读 · 0 评论 -
A FIRST EXPLORATION OF SOLRCLOUD
SolrCloud has recently been in the news and was merged into Solr trunk, so it was high time to have a fresh look at it.The SolrCloud wiki page gives various examples but left a few things unclea转载 2012-07-24 16:36:13 · 948 阅读 · 0 评论 -
浅谈solrCloud的分布式设计
在solr cloud 中一个collection是一个 文档的 集合。一个collection可以分为多个slice, 每个slice的实例和其备份(replica)都称为shard。一个shard与一个solr core 对应。 一个物理主机可以有多个solr core。 solr的Master-slave模式:(增加人手) 当对solr的r原创 2012-08-03 18:11:20 · 5474 阅读 · 3 评论 -
Using SolrJ
Using SolrJAttachments:2Added by Cassandra Targett, last edited by Drew Wheeler on Dec 21, 2011 (view change)SolrJ (also sometimes known as SolJava) is an API th转载 2012-07-30 10:00:49 · 1000 阅读 · 0 评论 -
Solr的自动完成/自动补充实现介绍(1): autoComplete
原文:http://java.dzone.com/news/solr-and-autocomplete-part-1 大部分人已经见过自动完成(autocomplete)的功能了(见下图),solr提供了构建这个功能的机制。今天,我将给你展示如何使用facet的方式来添加自动完成机制。 索引 设想你想在你的在线商店中,给用户一些提示,比如商品的名称。假设我们的索引构建转载 2012-08-15 17:02:46 · 1989 阅读 · 0 评论 -
Solr的自动完成/自动补充实现介绍(2):autoComplete
原文链接:Solr and Autocomplete (part 2) 在Solr的自动完成/自动补充实现介绍(第一部分) 中我介绍了怎么用faceting的机制来实现自动完成(autocomplete)的功能,今天我们来看一下如何用Suggester的组件来实现自动完成功能. 开始 这里有一点需要提醒:Suggest组件在1.4.1或以下版本不可用。要使用这个组转载 2012-08-15 17:29:35 · 1435 阅读 · 0 评论 -
Solr在tomcat和jetty中启动的相关配置
Solr的在web容器中的运行方式Solr是一个基于servlet的服务程序,需要servlet容器的支持。在example中,Solr实例采用的是基于jetty容器的。同样,也可以实现基于tomcat容器的配置。一、solr基于jetty容器的运行参考:wiki:http://wiki.apache.org/solr/SolrJettyhttp://lucidwo原创 2012-08-24 17:07:15 · 2901 阅读 · 0 评论