Lucene 与 Elastic

最新推荐文章于 2022-08-05 10:49:44 发布

人月IT

最新推荐文章于 2022-08-05 10:49:44 发布

阅读量286

点赞数 1

分类专栏： lucene-java 文章标签： lucene elasticsearch big data

本文链接：https://blog.csdn.net/dgutliangxuan/article/details/77412917

版权

lucene-java 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

https://www.elastic.co/guide/cn/elasticsearch/guide/current/_add_failover.html

一个运行中的 Elasticsearch 实例称为一个节点，而集群是由一个或者多个拥有相同 cluster.name 配置的节点组成，它们共同承担数据和负载的压力。当有节点加入集群中或者从集群中移除节点时，集群将会重新平均分布所有的数据。

当一个节点被选举成为主节点时，它将负责管理集群范围内的所有变更，例如增加、删除索引，或者增加、删除节点等。而主节点并不需要涉及到文档级别的变更和搜索等操作，所以当集群只拥有一个主节点的情况下，即使流量的增加它也不会成为瓶颈。任何节点都可以成为主节点。我们的示例集群就只有一个节点，所以它同时也成为了主节点。

作为用户，我们可以将请求发送到集群中的任何节点，包括主节点。每个节点都知道任意文档所处的位置，并且能够将我们的请求直接转发到存储我们所需文档的节点。无论我们将请求发送到哪个节点，它都能负责从各个包含我们所需文档的节点收集回数据，并将最终结果返回給客户端。 Elasticsearch 对这一切的管理都是透明的。

当第二个节点加入到集群后，3个副本分片将会分配到这个节点上——每个主分片对应一个副本分片。这意味着当集群内任何一个节点出现问题时，我们的数据都完好无损。

所有新近被索引的文档都将会保存在主分片上，然后被并行的复制到对应的副本分片上。这就保证了我们既可以从主分片又可以从副本分片上获得文档。

应对故障

https://www.elastic.co/guide/cn/elasticsearch/guide/current/_coping_with_failure.html

多大是太大了？

整个批量请求都需要由接收到请求的节点加载到内存中，因此该请求越大，其他请求所能获得的内存就越少。批量请求的大小有一个最佳值，大于这个值，性能将不再提升，甚至会下降。但是最佳值不是一个固定的值。它完全取决于硬件、文档的大小和复杂度、索引和搜索的负载的整体情况。

幸运的是，很容易找到这个

最佳点：通过批量索引典型文档，并不断增加批量大小进行尝试。当性能开始下降，那么你的批量大小就太大了。一个好的办法是开始时将 1,000 到 5,000 个文档作为一个批次, 如果你的文档非常大，那么就减少批量的文档个数。

密切关注你的批量请求的物理大小往往非常有用，一千个 1KB 的文档是完全不同于一千个 1MB 文档所占的物理大小。一个好的批量大小在开始处理后所占用的物理大小约为 5-15 MB。

你可能觉得由于 Elasticsearch 主分片数量是固定的会使索引难以进行扩容。实际上当你需要时有很多技巧可以轻松实现扩容。我们将会在扩容设计一章中提到更多有关水平扩展的内容。

Lucene第一天入门

第一步1.分词器
简单来说，分词器（分析器）就是用来对用户的输入的内容，进行拆解然后组装成好几个词语的工具
这里写图片描述
2.解决了什么？

第二步需求分析

从非结构化数据中提取出来的，然后重新组织的信息，我们叫做索引

先建立索引，在对索引进行搜索的过程叫做全文检索

人月IT

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Lucene 与 Elastic

Lucene第一天入门第一步1.分词器简单来说，分词器（分析器）就是用来对用户的输入的内容，进行拆解然后组装成好几个词语的工具 2.解决了什么？第二步需求分析从非结构化数据中提取出来的，然后重新组织的信息，我们叫做索引先建立索引，在对索引进行搜索的过程叫做全文检索
复制链接

扫一扫

专栏目录