sorl
wbj0110
这个作者很懒,什么都没留下…
展开
-
Hbase和solr在海量数据查询中的应用
对于历史数据的查询,在数据规模不大的情况下,可以用传统的关系型数据库,如oracle,mysql等,可以利用他们提供的索引功能,实现高效的查询。但是当数据上升到一定规模后,用传统的关系型数据库就不太合适了,当然可以把数据存到分布式数据库HBase中。HBase目前只支持对rowkey的一级索引,对于二级索引还不支持,当然可以把所有要索引的字段都拼接到rowkey中,根据hbase的fi...原创 2013-12-01 10:41:51 · 130 阅读 · 0 评论 -
Solr搜索服务架构图
gliffy上画的一张图 Solr的整体架构图: 更具体的solr request: Solr兼容lucene,多种方式建立索引的架构图:原创 2013-10-08 09:57:08 · 93 阅读 · 0 评论 -
solr 搜索架构优化
solr 搜索架构优化 刚刚将solrt升级到最新版本3.6.1,除了精简了索引结构设计,新版本的天生优势更加重要,比之前solr1.4的性能算是小部分提升,响应由100ms以内占80%升到了90%,且搜索系统稳定性好了很多,出现挂掉的机率降低了,当然还得继续观察。同时优化了旧的搜索系统架构 ,加上系统的配置优化管理,方便修改调整,对外提供的接口重新设计了一翻,加入了一些请求...原创 2013-10-07 16:14:06 · 117 阅读 · 0 评论 -
Lucene打分规则
搜索排序结果的控制 Lucnen作为搜索引擎中,应用最为广泛和成功的开源框架,它对搜索结果的排序,有一套十分完整的机制来控制;但我们控制搜索结果排序的目的永远只有一个,那就是信息过滤,让用户快速,准确的找到其想要的结果,丰富用户体验。 以前看过一个牛人的博客,总结了4个地方,可对Lucene检索结果的排序进行控制,现在已经记不住。我自己简单整理了下面几个,若有疏漏,欢迎补...原创 2013-09-24 09:04:14 · 229 阅读 · 0 评论 -
Solr的自动完成实现方式(Suggester方式)
组件配置 在上一期的配置组件中添加如下的参数:<str name="sourceLocation">dict.txt</str> 这样我们的配置就变成了: <searchComponent name="suggest" class="solr.SpellCheckComponent"> <lst name=&qu原创 2013-09-10 09:45:10 · 120 阅读 · 0 评论 -
solr性能调优
Schema Design Considerations indexed fields indexed fields 的数量将会影响以下的一些性能: 索引时的时候的内存使用量 索引段的合并时间 优化时间 索引的大小 我们可以通过 将 omitNorms=“true” 来减少indexed fields数量增...原创 2013-09-07 11:40:47 · 142 阅读 · 0 评论 -
solr在电商平台中的使用示例简析
在电商平台中搜索是非常重要的功能,主要包括有搜索词类目导航、自动提示和搜索排序功能自动提示如下图显示的,可以根据搜索词自动进行提示,并在列表中显示推荐的搜索词的document数量 类目导航如下图所示,比如在搜索框中搜索“牛奶”,则把相关的类目和当前类目对应的属性显示出来 下面就以上几种功能做示例讲解。1、搜索排序搜索功能中比较复杂的是文档的打分排序...原创 2014-02-23 10:41:36 · 199 阅读 · 0 评论 -
实时分布式搜索引擎 Solandra
Solandra (原名为 Lucandra) = Cassandra + LuceneSolandra = Solr + CassandraSolandra 是一个实时的分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 构建.在线PPT演示:https://docs.google.com/present/view?id=d93fq7n_20fnj...原创 2013-12-04 10:11:22 · 582 阅读 · 0 评论 -
Nutch相关框架安装使用最佳指南(转)
Chinese installing and using instruction - The best guidance in installing and using Nutch in China 国内首套免费的《Nutch相关框架视频教程》 土豆在线观看地址:http://www.tudou.com/home/item_u106249539s0p1.html 超清原版下...原创 2013-12-02 09:34:26 · 197 阅读 · 0 评论 -
SOLR4.2+NUTCH1.6
1、SOLR4.2集成NUTCH1.6wget http://labs.mop.com/apache-mirror/lucene/solr/4.2.0/solr-4.2.0.tgz tar -xzvf solr-4.2.0.tgz cd solr-4.2.0/example 复制nutch的conf目录中的schema-solr4.xml文件到solr/collectio...原创 2014-03-24 09:47:24 · 134 阅读 · 0 评论