elasticsearch
文章平均质量分 64
Gedun_
这个作者很懒,什么都没留下…
展开
-
Elasticsearch分⽚及其⽣命周期
分⽚的内部原理什么是 ES 的分⽚: ES 中最⼩的⼯作单元 / 是⼀个 Lucene 的 Index。 ⼀些问题: 为什么 ES 的搜索是近实时的(1 秒后被搜到)? ES 如何保证在断电时数据也不会丢失? 为什么删除⽂档,并不会⽴刻释放空间? 倒排索引不可变性倒排索引采⽤ Immutable Design,⼀旦⽣成,不可更改 不可变性,带来了的好处如下:⽆需考虑并发写⽂件的问题,避免了锁机制带来的性能问题 ⼀旦读⼊内核的⽂件系统缓存,便留在哪⾥。只要⽂件系统存有⾜够的原创 2021-04-18 19:20:01 · 287 阅读 · 0 评论 -
Elasticsearch⽂档分布式存储
⽂档存储在分⽚上⽂档会存储在具体的某个主分⽚和副本分⽚上:例如 ⽂档 1, 会存储在 P0 和 R0 分⽚上 ⽂档到分⽚的映射算法 确保⽂档能均匀分布在所⽤分⽚上,充分利⽤硬件资源,避免部分机器空闲,部分机器繁忙 潜在的算法 随机 / Round Robin。当查询⽂档 1,分⽚数很多,需要多次查询才可能查到 ⽂档 1 维护⽂档到分⽚的映射关系,当⽂档数据量⼤的时候,维护成本⾼ 实时计算,通过⽂档 1,⾃动算出,需要去那个分⽚上获取⽂档 ⽂档到分⽚的路由算法shard = ha原创 2021-04-18 19:06:31 · 123 阅读 · 0 评论 -
Elasticsearch集群及选主与脑裂问题
分布式特性 Elasticsearch 的分布式架构带来的好处 存储的⽔平扩容,⽀持 PB 级数据 提⾼系统的可⽤性,部分节点停⽌服务,整个集群的服务不受影响 Elasticsearch 的分布式架构 不同的集群通过不同的名字来区分,默认名字 “elasticsearch” 通过配置⽂件修改,或者在命令⾏中 -E cluster.name=geektime 进⾏设定 Coordinating Node处理请求的节点,叫 Coordinating Node 路由请求到正确的节原创 2021-04-18 17:11:03 · 319 阅读 · 0 评论 -
Elasticsearch基本概念(2)
节点Master-eligible nodes 和 Master Node每个节点启动后,默认就是一个Master eligible节点 可以设置 node.master:false 禁止 Master-eligible节点可以参加选主流程,成为Master节点 当第一个节点启动时候,它会将自己选举成Master节点 每个节点上都保存了集群的状态,只有Master节点才能修改集群的状态信息 任意节点都能修改信息会导致数据的不一致性 集群状态(C山ster State),维护了一个集.原创 2021-04-18 14:35:57 · 100 阅读 · 1 评论 -
Elasticsearch基本概念(1)
Elasticsearch基本概念Index索引type类型 document文档Node节点Shard节点文档(Document)Elasticsearch是面向文档的,文档是所有可搜索数据的最小单位 日志文件中的日志项 一本电影的具体信息/—张唱片的详细信息 MP3播放器里的一首歌/ 一篇PDF文档中的具体内容 文档会被序列化成JSON格式,保存在Elasticsearch中 JSON对象由字段组成 ..原创 2021-04-18 01:08:15 · 88 阅读 · 0 评论 -
Elasticsearch中text与keyword的区别
text类型1:支持分词,全文检索,支持模糊、精确查询,不支持聚合,排序操作; 2:test类型的最大支持的字符长度无限制,适合大字段存储;使用场景: 存储全文搜索数据, 例如: 邮箱内容、地址、代码块、博客文章内容等。 默认结合standard analyzer(标准解析器)对文本进行分词、倒排索引。 默认结合标准分析器进行词命中、词频相关度打分。keyword类型1:不进行分词,直接索引,支持模糊、支持精确匹配,支持聚合、排序操作。2:keyword原创 2021-04-14 15:12:40 · 132 阅读 · 0 评论