Solr
张包峰
Distributed Computing
展开
-
Solr配置搜索服务
背景我用Lucene3.6,为php语言搭建的平台提供一套搜索服务,但是lucene只是个提供索引操作的库,需要一个web-service来提供给java外的语言,使之可以通过http方式发送搜索请求并得到如json, xml格式的查询结果集数据。而Solr是一个二次包装了Lucene库的搜索服务容器,兼容lucene的api,可以在jetty或者Tomcat这样的容器里以web服务的方式启动原创 2013-01-05 17:32:03 · 4604 阅读 · 1 评论 -
solr进阶: 如何定制搜索服务,扩展搜索逻辑
前两天发了篇"剖析solr实用性",主要黑了solr建索引让我觉得不舒服,还黑了solr只是个通用的丢入了servlet容器里的简单服务,事实证明我错了。这篇博客我要纠正并回答那篇博客里自己总结的问题:如何定制solr实现自己的搜索服务。solr是一个可扩展的服务,我们可以添加自己的包和类,在solr已经实现的default处理逻辑之上,再添加我们自己的搜索逻辑。实现手段就是继承solr的基础原创 2013-01-14 21:49:18 · 7121 阅读 · 6 评论 -
Solr搜索服务架构图
分享我自己的Solr搜索服务架构图以及几张Solr的架构图。在Google Doc上的两页ppt:刚开始在gliffy上画的同上的一张图Solr的整体架构图:更具体的solr request:Solr兼容lucene,多种方式建立索引的架构图:更多关于如何定制solr搜索服务的文章,见之原创 2013-01-17 14:51:02 · 12290 阅读 · 1 评论 -
剖析solr实用性
我的使用经历使用solr3.6版本,配合自己用lucene3.6建立的索引,搭建了一个搜索服务,前台通过http访问solr服务,获取由solr排序后的结果集。环境是linux ubuntu,servlet容器是tomcat。这个搜索服务是提供给php开发人员使用的。根据我现在对solr的理解和使用感受,我想说说solr这玩意儿的实用性。我对solr的理解solr包装了luce原创 2013-01-11 12:34:34 · 3715 阅读 · 0 评论 -
学术分享搜索平台——设计方案
项目背景有两类和我们大学生息息相关的产品。一类是微博,人人,豆瓣这些偏SNS的社交平台,推荐同学朋友的信息,帮助我们找到可能认识的人,可能喜欢的书,可能爱看的电影等等。另一类是学术相关的搜索引擎,比如Google Scholar,Microsoft Academic Search Engine,通过搜索关键字,提供一些匹配度最高的学术论文,提供很多便利。然而,学术搜索引擎是一个比较通用原创 2013-03-20 19:35:44 · 6156 阅读 · 8 评论 -
学术分享搜索平台——中期报告
一、 项目概况学术分享搜索引擎主要基于爬取的学术数据,提供搜索,可视化,推荐三大块功能,并且支持用户分享感兴趣的学术资源,结合“众包”来打造一个更社交化的学术搜索平台。相比于传统的学术搜索,可视化和用户的加入能让平台帮助用户发现更多的东西。我的工作是整个平台的开发和搭建。从数据上说,涵盖了数据爬取,数据处理,分布式存储,建立索引等工作;从功能上说,涵盖了网站搭建,搜索服务,可视化原创 2013-05-05 17:57:35 · 6184 阅读 · 0 评论 -
Solr集群架构概述及delta-import详细配置
背景由于项目原因,重新熟悉了下Solr,版本为3.6,搭建了主从Solr服务,并使用DIH从RDBMS数据源增量更新索引。其实也没什么技术含量,就是简单做个总结,分别从部署架构和增量更新两个方面说明下。Solr Replicationsolr的主从其实是他的replication集群,从本质上说是通过ReplicationHandler来实现的,除了solr server之间可以互相同步之外,每个solr实例内部的core之间也是可以实现同步的,而能自身同步自身的实例称为Repeater,它的存在原创 2013-12-18 17:43:37 · 11797 阅读 · 0 评论