elasticsearch
文章平均质量分 95
东方鲤鱼
业精于勤荒于嬉
展开
-
【Elasticsearch】相关性,近义词匹配,纠错匹配
【Elasticsearch】相关性,近义词匹配,纠错匹配原创 2023-06-21 16:16:48 · 2411 阅读 · 0 评论 -
【Elasticsearch】 实际生产中的监控及调优
一个 Elasticsearch 集群至少包括一个节点和一个索引。或者它可能有一百个数据节点、三个单独的主节点,以及一小打客户端节点——这些共同操作一千个索引(以及上万个分片)。不管集群扩展到多大规模,你都会想要一个快速获取集群状态的途径。API 充当的就是这个角色。你可以把它想象成是在一万英尺的高度鸟瞰集群。它可以告诉你安心吧一切都好,或者警告你集群某个地方有问题。原创 2023-06-20 15:16:20 · 4780 阅读 · 0 评论 -
【Elacticsearch】 集群发现机制 ,分片&副本机制,负载机制,容错机制,扩容机制, 分片路由原理
Elasticsearch采用了master-slave模式, ES会在集群中选取一个节点成为主节点,只有Master节点有资格维护全局的集群状态,在有节点加入或者退出集群的时候,它会重新分配分片,并将集群最新状态发送给集群中其它节点,主节点会以周期性ping的方式以验证其它节点是否存活。非Master节点也会监听Master节点进行错误检测,如果成员节点发现master连接不上,重新加入新的Master节点,如果发现当前集群中有很多节点都连不上master节点,那么会重新发起选举。原创 2023-06-19 18:37:19 · 799 阅读 · 0 评论 -
【Elasticsearch】 之 Translog/FST/FOR/RBM算法
es是近实时的存储搜索引,。近实时,并不能保证被立刻看到。数据被看到的时候数据已经作为一个提交点,被写入到了文件系统中(这个过程称为refresh)。因为一次写入的成本相对比较大,所以用攒一波批量提交的方式,写入性能会更好。不管这些数据都是在堆内存中还是在文件系统中(Filesystem Cache),如果发生断电,或者JVM的崩溃,则这部分数据一定会丢失。为了防止数据丢失,这部分数据会被写入到traslog中一份。原创 2023-06-16 18:33:54 · 1837 阅读 · 0 评论 -
【Elasticsearch】面试题汇总(2023.6)
ES索引优化主要从两个方面解决问题: 一、索引数据过程 大家可能会遇到索引数据比较慢的过程。其实明白索引的原理就可以有针对性的进行优化。ES索引的过程到相对Lucene的索引过程多了分布式数据的扩展,而这ES主要是用tranlog进行各节点之间的数据平衡。所以从上我可以通过索引的settings进行第一优化: 这两个参数第一是到tranlog数据达到多少条进行平衡,默认为5000,而这个过程相对而言是比较浪费时间和资源的。所以我们可以将这个值调大一些还是设为-1关闭,进而手动进行tranlog平衡。原创 2023-06-16 17:41:23 · 1753 阅读 · 0 评论 -
【Elacticsearch】 倒排索引的查增删改原理
倒排索引的查增删改原理原创 2023-06-16 16:54:06 · 936 阅读 · 0 评论 -
【Elacticsearch】 原理/数据结构/面试经典问题整理
对Elacticsearch 原理/数据结构/面试经典问题整理的文章;原创 2023-06-15 19:21:11 · 1208 阅读 · 0 评论