ElasticSearch特点
1. 天然分片,天然集群: es 把数据分成多个shard,下图中的P0-P2,多个shard可以组成一份完整的数据,这些shard可以分布在集群中的各个机器节点中。随着数据的不断增加,集群可以增加多个分片,把多个分片放到多个机子上,已达到负载均衡,横向扩展。 这种集群分片的机制造就了elasticsearch强大的数据容量及运算扩展性。

在实际运算过程中,每个查询任务提交到某一个节点,该节点必须负责将数据进行整理汇聚,再返回给客户端,也就是一个简单的节点上进行Map计算,在一个固定的节点上进行Reduces得到最终结果向客户端返回。

2. 天然索引:ES 所有数据都是默认进行索引的,这点和mysql正好相反,mysql是默认不加索引,要加索引必须特别说明,ES只有不加索引才需要说明。
而ES使用的是倒排索引和Mysql的B+Tree索引不同。
倒排索引是怎么处理的 :
全文搜索引擎目前主流的索引技术就是倒排索引的方式。
传统的保存数据的方式都是
记录→单词

而倒排索引的保存数据的方式是
单词→记录
例如 > 搜索“红海行动”
但是数据库中保存的数据如图:
那么搜索引擎是如何能将

ElasticSearch以其天然分片和集群能力提供强大的数据容量和扩展性。其数据默认索引采用倒排索引,不同于MySQL的B+Tree,实现快速搜索。Lucene作为ElasticSearch的核心,提供了分词和倒排索引构建。尽管Lucene消耗更多资源,但通过内存中的Term Index加速,提高了搜索效率。ElasticSearch作为基于Lucene的搜索引擎服务,已在众多知名企业中广泛应用。
最低0.47元/天 解锁文章
1064

被折叠的 条评论
为什么被折叠?



