Elasticsearch

Elasticsearch是一款效率很高的搜索引擎,他底层基于Lucene

首先介绍一下搜索引擎:

当我们需要在海量数据中查找某一个数据时,用关系型数据库,使用像Like这种查询语句是不现实的,这种查询进行全表检索,效率极低,而且一不小心会是数据库服务器崩溃,这时候我们就需要使用搜索引擎来进行海量数据的检索

一般搜索引擎分为以下几步:

1.将需要进行检索的文本或者Pdf等内容,进行转换,形成搜索引擎内部专用的文档格式

2.文档分析,常见的是使用分词器将文档分成不同的token片段,这些片段也是我们进行检索的主要目标,对文档的分析十分重要,这决定了我们检索的准确率

3.文档索引,文档索引就是根据用户输入的搜索内容,找到相匹配的token片段,然后根据token再找到对应的文档,可以在检索时给文档分配权重,从而可以根据相关度进行排序

ES

ES主要包含以下内容:

 

1.索引,每种具有类似特性的文档集合,概念类似于关系型数据库中的数据库的概念,我们会将某一个业务系统的数据放到相对应的数据库中

2.类型,类型的概念类似于关系型数据库中的表,我们以类型区分同一个索引中的不同数据

3.文档,文档就相当于关系型数据库中的每一条记录了,也是我们最终检索的内容

4.节点,我们将每一台ES服务器都称作一个节点,节点是相对于集群的一个概念,集群中的某一台机器就是一个节点

5.分片,ES的分片机制可以将一个索引分步的存储于不同的节点上,从而可以提高检索效率

6.副本,分片可以将索引分布存储在不同的节点上,此时这些节点就有主分片和副本分片,主分片用来写入索引,当有索引写入时他会同时将索引内容写到其他ES节点上,副本节点存在的意义就是数据冗余从而增加数据的高可用性,同时再查询时降低了主分片服务器的压力,提高检索效率

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值