文本索引
文章平均质量分 75
zachary_OOM
大数据传道者。专注大数据/云计算,hadoop,spark
联系方式:zachary880914@163.com
https://github.com/zacharyzhanghao
展开
-
自学大数据:基于Solr实现HBase的文本索引
使用目的: HBase目前只支持对rowkey的一级索引,对于二级索引还不支持,当然可以把所有要索引的字段都拼接到rowkey中,根据hbase的filter功能进行查询,但是这样操作数据会涉及到全表扫描,效率很低,速度慢,不利于后期扩展。并且,通过HBase自己的索引,实现数据量统计,分页,中文索引几乎不可能。所以,基于solr为HBase创建索引,就显得更有价值。原创 2014-10-09 13:47:32 · 3706 阅读 · 0 评论 -
强大的大数据全文索引解决方案-ClouderaSearch
介绍 ClouderaSearch带来了全文索引,实时查询和针对CDH和你的企业级数据中心的扩展、灵活性的索引服务。由Apache Hadoop和Apache Solr提供,是企业级的开源搜索。Cloudera Search带来了扩展性和可靠性的新一代集成,多个工作任务的搜索。通过它与CDH独特的整合,Cloudera Search获得了同样的容错性,扩展性,可见性,安全性,以及灵活性的提供其他翻译 2014-10-15 10:05:08 · 2587 阅读 · 0 评论 -
安装solr在tomcat服务器下
在linux下以下三步是必须的: 1、java1.7以上的版本 2、在Solr 的lib/ext目录下的jar包(比如在/opt/solr/example/lib/ext)必须拷贝到$CATALINA_HOME/lib/目录下 3、资源文件log4j.properties(比如在/opt/solr/example/resource)必须拷贝到$CATALINA_HOME/lib/目录下原创 2014-10-09 16:55:02 · 1214 阅读 · 0 评论