目录
Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用Elasticsearch的水平伸缩性,能使数据在生产环境变得更有价值。
Elasticsearch 的实现原理主要分为以下几个步骤
- 首先用户将数据提交到Elasticsearch 数据库中
- 再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据
- 当用户搜索数据时候,再根据权重将结果排名,打分
- 再将返回结果呈现给用户。
Elastic Stack(ELK stack)
E---Elasticsearch 数据存储、查询
L---Logstash 数据收集和日志解析引擎
K---Kibana 分析和可视化平台
Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。Elasticsearch是分布式的,这意味着索引可以被分成分片,每个分片可以有0个或多个副本。每个节点托管一个或多个分片,并充当协调器将操作委托给正确的分片。再平衡和路由是自动完成的。相关数据通常存储在同一个索引中,该索引由一个或多个主分片和零个或多个复制分片组成。一旦创建了索引,就不能更改主分片的数量。
Elasticsearch的底层是开源库 Lucene。但是,你没法直接用 Lucene,必须自己写代码去调用它的接口。Elasticsearch是 Lucene 的封装,提供了 REST API 的操作接口,开箱即用。
总结起来就是,在大数据量时使用Elasticsearch可以提高搜索效率。
最常见的使用场景就是电商网站搜索商品,或者在日志系统中搜索日志时,或者百度等搜索引擎等等。如果使用传统的关系型数据库进行模糊查询,那么就有可能会出现索引失效的情况,导致执行效率非常的低(数据量大的情况下)
如:select age from user where name like “%航%”
Elasticsearch概念(以下简称Elastic )
关系型数据库 |
Elasticsearch |
数据库(database) |