es+Hbase

一、ES+Hbase解决的问题

  • 实现【海量数据的存储】+【快速复杂查询的】解决方案
  • 整合的基本原理
    在这里插入图片描述

二、ES核心原理

Elasticsearch是一个实时的分布式【搜索和分析引擎】
♦ 它是对Lucene进行了封装,能够达到实时搜索,提供稳定 ,可靠,快速,等特点

在这里插入图片描述

  • 核心概念

2.1、Cluster(集群)

	代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举
产生的,主从节点是对于集群内部来说的。 ES的一个概念就是去中心化,字面上理解就是无中
心节点,这 是对于集群外部来说的,因为从外部来看ES集群,在逻辑上是个 整体,你与任
何一个节点的通信和与整个ES集群通信是等价的。

	主节点的职责是负责管理集群状态,包括管理分片的状态和副本的状态,以及节点的发现
和删除。

	注意:
	主节点不负责对数据的增删改查请求进行处理,只负责维 护集群的相关状态信息;

2.2、shards(分片)

	代表索引分片,ES可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的
索引水平拆分成多个,分布到不同的 节点上。构成分布式搜索,提高性能和吞吐量。分片的
数量只能在创建索引库时指定,索引库创建后不能更改。
	默认是一个索引库有5个分片)每个分片中最多存储 lnteger.MAXVALUE-128 条数据。

2.3、Replicas(副本)

	代表索引分片的副本,副本的作用:一是提高系统的容错性,当 某个节点某个分片损坏
或丢失时可以从副本中恢复。二是提高ES 的查询效率,ES会自动对搜索请求进行负载均衡。
副本的数量可以随时修改。
	注意:主分片和副本不会存在一个节点中

2.4、Recovery(恢复)

	代表数据恢复或叫数据重新分布,ES在有节点加入或退出时会根据 机器的负载对索引分
片进行重新分配,挂掉的节点重新启动时也会 进行数据恢复

三、ElasticSeach的使用

	可以通过RestAP操作或者SDK(JavaAPI)操作
	使用 RestAPI 操作日 asticsearch
	使用 JavaAPI 操作 Elasticseajch

四、ElasticSeach的分词

4.1、分词器作用

	Analyzer (分词器)的作用是把一段文本中的词按一定规则进 行切分。对应的是
Analyzer类,这是一个抽象类,切分词的具 体规则是由子类实现的,所以对于不同的语
言,要用不同的分 词器。(也就是说不同的分词器分词的规则是不同的!)
	在创建索引时会用到分词器,在搜索时也会用到分词器,这 两个地方要使用同一个
分词器,否则可能会搜索不出结果。

在这里插入图片描述

4.2、分词工作流程

	1、切分关键词
	2、去除停用词(的、了、是、a、an. the)
	3、对于英文单词,把所有字母转为小写(搜索时不区分大小写)

几个重要的分得器
	1 分词器分词方式
		StandardAnalyzer 单字分词
		ChineseAnalyzer  单字分词
		CJKAnalyze       二分法分词 
		IKAnalyzer       词库分词

  • 中文分词器工作原理
	单字分词:”我们是中国人“效果:”我““们“”是““中一国…人”
	二分法分词:按两个字进行切分。效果:“我们二”们是“ 、“是中二”中国“、“国人”。
	词库分词:按某种算法构造词,然后去匹配已建好的词库集合,如果匹配到就切分出
来成为词语。通常词库分词被认为是最理想的中文分词算法。

在这里插入图片描述

五、Hbase基本介绍

	HBase - Hadoop Database:是一个高可靠、高性能、 面向列、可伸缩的NoSQL数据
库(Key-Value类型)
	HBase基于H DFS作为其文件存储系统
	HBase支持对海量数据的增删改查

在这里插入图片描述

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: ElasticsearchHBase 都是流行的大数据处理工具,可以被集成在一起使用以满足特定的需求。 Elasticsearch 是一个开源的实时分布式搜索和分析引擎,主要用于存储、搜索和分析海量的非结构化和半结构化数据。它具有高可扩展性、性能优越和易于使用的特点,适用于日志分析、全文搜索、指标分析等场景。与其相比,HBase 是一个开源的分布式列存储系统,具有极高的读写性能和大规模扩展性,适用于存储和处理海量结构化数据。 将 ElasticsearchHBase 集成在一起可以发挥两者的优势。可以使用HBase作为Elasticsearch的数据源,将结构化数据存储在HBase中,通过Elasticsearch进行数据的实时搜索和分析。这种集成方式可以兼顾结构化和非结构化数据的处理需求,使得数据的存储和查询更加高效和灵活。 此外,由于Elasticsearch具有分布式的特点,通过与HBase的集成,可以进一步提升数据的容错性和可扩展性。采用HBase作为Elasticsearch的数据存储后端,可以通过HBase内置的负载均衡和数据分区功能将数据分散存储在不同的节点上,实现数据的高可用和分布式处理。同时,HBase从设计上支持横向扩展,可以轻松地扩展存储容量和吞吐量,满足不断增长的数据处理需求。 综上所述,ElasticsearchHBase的集成可以充分发挥两者的优势,实现对结构化和非结构化数据的高效存储、索引和查询。这种集成方式可以应用于各种领域,如日志分析、在线广告、电子商务等,为用户提供更好的数据处理和分析能力。 ### 回答2: ElasticsearchHBase是两种不同的开源分布式数据库系统。它们各自有不同的特点和适用场景。 Elasticsearch是一个全文搜索引擎,用于快速、实时地搜索和分析大量数据。它基于Lucene库构建,提供了分布式的搜索和分析功能。Elasticsearch支持实时索引和搜索,适用于需要快速查询和高可用性的场景。它在海量数据上表现出色,并具有良好的扩展性和可靠性。 而HBase则是一个分布式、可扩展的列式数据库,用于存储大规模结构化数据。它基于Hadoop的HDFS文件系统,适用于需要高度可靠性和扩展性的大数据存储场景。HBase支持面向列的数据存储和查询,并提供ACID事务保障。它适用于需要大规模并发读写和随机访问的场景。 当需要将ElasticsearchHBase集成时,通常是为了利用它们各自的优势来满足复杂的应用需求。例如,可以使用HBase来存储大规模的结构化数据,同时使用Elasticsearch进行实时搜索和分析。在这种集成方案中,HBase作为数据存储层,而Elasticsearch用于提供高效的实时搜索和查询功能。 通过将两者集成,可以在HBase上存储大规模的数据,同时使用Elasticsearch进行快速的全文搜索和分析。这种集成方案可以使得数据的存储和查询具备更高的效率和性能。同时,由于Elasticsearch具有良好的可伸缩性和高可用性,因此还可以提高系统的稳定性和容错性。 总而言之,ElasticsearchHBase的集成可以为大规模数据存储和实时搜索需求提供一个理想的解决方案。这种集成方案可以充分发挥两者的优势,提供高效、可靠的数据存储和搜索能力,满足复杂的应用场景需求。 ### 回答3: ElasticsearchHBase是两个开源的分布式数据存储和搜索系统,具有不同的特点和应用场景。他们可以相互集成,以提供更强大的数据存储和搜索能力。 首先,Elasticsearch是一个用于全文搜索和分析的分布式实时搜索引擎。它可以通过将数据索引到倒排索引中,以高效地执行全文搜索、实时分析和数据聚合。Elasticsearch还具有分布式的架构,能够自动处理数据的分片和复制,并实现高可用性。它还提供了灵活的查询语言和API,以便于开发者进行复杂的搜索和分析操作。 而HBase是一个建立在Hadoop上的分布式列式数据库。它以Hadoop的分布式文件系统HDFS作为底层存储,支持海量数据的存储和处理。HBase具有强大的随机读写能力,并且是一个高度可扩展的系统。它适用于需要快速随机访问大规模结构化数据的应用场景,例如日志分析、订单处理等。 集成ElasticsearchHBase可以利用它们各自的优势,实现更丰富的数据存储和搜索功能。一种常见的方案是使用HBase作为主数据存储,而使用Elasticsearch作为辅助索引和搜索引擎。当数据变更时,可以将数据同步到Elasticsearch中进行实时索引更新,以支持更快速的全文搜索和复杂的查询分析。这样一方面可以保证数据的高可靠性和可扩展性,另一方面可以提供更优秀的搜索性能和用户体验。 总而言之,ElasticsearchHBase可以通过集成实现更强大的数据存储和搜索能力。这种集成方案可以根据实际应用场景的需要进行灵活的设计和部署,为用户提供更好的数据分析和搜索体验。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值