自学大数据：基于Solr实现HBase的文本索引

最新推荐文章于 2022-03-20 19:50:30 发布

zachary_OOM

最新推荐文章于 2022-03-20 19:50:30 发布

阅读量3.7k

点赞数

分类专栏：文本索引文章标签：大数据 solr hbase 索引

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shifenglov/article/details/39929693

版权

本文介绍了在HBase不支持二级索引的情况下，如何利用Solr进行文本索引以实现高效查询。阐述了Solr的特性、基于Solr的HBase多条件查询原理，并探讨了三种在HBase上建立Solr索引的方法，包括各自的优缺点。建议在实际操作中结合使用第一种（普通API）和第二种（MapReduce）方案。

摘要由CSDN通过智能技术生成

前言

最近接触的项目中，需要针对HBase的数据进行索引查询，主要支持中文查询，分页查询等。在此情况下，学习了搜索服务器solr。总结了一些方法和经验，正好可以分享个大家，鼓励自己，共同学习。

使用目的

HBase目前只支持对rowkey的一级索引，对于二级索引还不支持，当然可以把所有要索引的字段都拼接到rowkey中，根据hbase的filter功能进行查询，但是这样操作数据会涉及到全表扫描，效率很低，速度慢，不利于后期扩展。并且，通过HBase自己的索引，实现数据量统计，分页，中文索引几乎不可能。所以，基于solr为HBase创建索引，就显得更有价值。

名词解析

Solr： Solr是一个高性能，采用Java5开发，基于Lucene的全文搜索服务器。同时对其进行了扩展，提供了比Lucene更为丰富的查询语言，同时实现了可配置、可扩展并对查询性能进行了优化，并且提供了一个完善的功能管理界面，是一款非常优秀的全文搜索

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。