solr
文章平均质量分 80
小新8
这个作者很懒,什么都没留下…
展开
-
Solr 安装配置使用
到Apache官网下载solr:http://lucene.apache.org/solr/我下载的是solr-4.10.2,jdk使用的是7。目录结构:example文件夹里面有start.jar这个启动jar包,用命令行的方式就能启动solr了,内部是用jetty来启动的。E:\solr-4.10.2\example>java -jar start.jar看原创 2014-12-02 21:53:13 · 1185 阅读 · 0 评论 -
solr进阶八:jQuery UI Autocomplete与solr搜索结合
大致的流程:页面捕获到文字 --> 传到servlet(Controller)层,servlet层调用后台 --> 后台根据servlet层传来的参数进行动态从solr中获取数据 --> solr 数据返回到servlet层,解析 --> 展现到页面上。原创 2014-12-11 17:50:24 · 1958 阅读 · 0 评论 -
solr进阶一:java代码添加索引和增加IKAnalyzer分词支持
观察solr的工作环境solr_tomcat\solr\collection1\,在这里面存在两个文件夹:conf和data。其中conf里存放了对solr而言最为重要的两个配置文件schema.xml和solrconfig.xml,前者是索引字段等的设置,后者是性能的设置。data文件夹则用于存放索引文件。schema.xml主要包括types、fields和其他的一些缺省设置。solr原创 2014-12-03 15:27:41 · 5190 阅读 · 2 评论 -
solr进阶三:从数据库中导入数据到solr
要建立自己的全文检索,一般都需要从数据库导入数据,在原来配置的基础上,增加导入的功能,这里以mysql为例子:在solr的工作目录中选择一个core,我这里选择core1。进入配置文件夹:solr_tomcat\solr\core1\conf 。在solrconfig.xml中添加如下代码: data-config.xml 在同原创 2014-12-04 10:11:00 · 6522 阅读 · 0 评论 -
solr进阶四:创建文件索引
索引数据源并不会一定来自于数据库、XML、JSON、CSV这类结构化数据,很多时候也来自于PDF、word、html、word、MP3等这类非结构化数据,从这类非结构化数据创建索引,solr也给我们提供了很好的支持,利用的是apache tika。下面我们来看看在solr4.10中如何从pdf文件创建索引。先配置文件索引新建core,存储文件型索引,具体步骤参考:http://bl原创 2014-12-04 11:54:30 · 5336 阅读 · 0 评论 -
solr进阶七:与jQuery结合的自动补全功能
网上有大量的jQuery自动补全功能的插件,我实现这个功能是采用网友写好的纯jQuery代码,而不是采用插件,因为特效会差很多。而后台的数据是从solr那边获取过来,通过整理,放到对象中,再放到集合中,然后在servlet层解开,生成xml文件,返回到前台,形成自动提示补全的功能,流程非常简单,没有采用框架技术,只是用了JSP的servlet来做中间层而已。原创 2014-12-09 11:42:30 · 3619 阅读 · 2 评论 -
solr进阶六:单机版Solr Cloud
Solr Cloud就是分布式的solr,具有分布式处理的优点:高可用性,高容错性,高容灾性。下面就以单机来部署一个两个节点的solr服务,初步认识一下Solr Cloud。Solr Cloud使用zookeeper作为集群管理工具,solr发布包里面就已经内嵌了zookeeper。一、准备工作建立一个solr工作目录,我建立在E:\solr_tomcat:E:\solr_tomcat\s原创 2014-12-09 10:59:28 · 1771 阅读 · 0 评论 -
solr进阶九:solr对数字和单个字符的搜索
solr中配有分词器,但分词器里面有大写转换为小写的过滤器时,数字就会被过滤。比如123中国ABC。123就会被过滤掉了,所以才查1|12|123都会失败。《Solr 数字字符不能搜索的一个问题》这篇博文说得还算详细,我就是学这篇文章的。 根据账号来搜索,当账号在数据库中是整型变量时,导入到solr中,配置单个数字的过滤字段时,是搜索不出任何信息的,这不知什么原因,有时间要好好研究一下原创 2014-12-12 18:03:18 · 8598 阅读 · 3 评论 -
solr进阶五:Solr缓存技术
原文:Solr4.7缓存技术磁盘IO往往是计算机系统响应速度的一个突出瓶颈,搜索引擎查询很平凡,减少搜索过程中的磁盘IO对提升搜索响应速度无疑有莫大的帮助,在solr中,提供自带的缓存机制。我们只需要在solrconfig.xml中加几个配置项就可以了。下面我们看看solr的3个缓存。Filter cache:这个是被用来缓存过滤器(就是查询参数fq)的结果和基本的枚举类型。转载 2014-12-04 13:58:57 · 2680 阅读 · 0 评论 -
solr进阶二:新建core
在solr的开发包里面的示例文件夹里面,有multicore(多核)这个例子。 把其中的一个core文件夹复制粘贴到我们的solr工作空间目录中就可以了。这个工作空间目录就是我们前面在apache-tomcat-6.0.43\webapps\solr\WEB-INF的web.xml文件里面设置的信息,如下: solr/home E:/solr原创 2014-12-03 16:56:16 · 3884 阅读 · 0 评论 -
Solr好的博客
Solr:文本分析文本分析时搜索引擎的核心工作之一,对文本包含许多处理步骤,比如:分词、大写转小写、词干化、同义词转化等。简单的说,文本分析就说将一个文本字段的值转为一个一个的token,然后被保存到Lucene的索引结构中被将来搜索用。当然,文本分析不仅在建立索引时有用,在查询时对对所输入的查询串也一样可以进行文本分析。地址: http://www.cnblogs.com/zho转载 2016-04-11 16:28:29 · 809 阅读 · 1 评论