Elasticsearch快速入门 基础篇 Elasticsearch各版本特性
文章目录
前言
通过上节的内容,相信你已经对 Elasticsearch 概念及主要功能有了一个基本的认识,本文将带你一起探索 Elasticsearch 的版本特性。
一、Elasticsearch 5.x之前
Elasticsearch 5.x 和 Elasticsearch 2.x 并不区别很大。早期的 Elasticsearch 版本各种很混乱,直接升级到5.0了。
二、Elasticsearch 5.x
主要特性:
-
基于 Lucene 6.x
查询性能提升25%,默认打分机制从 TF-IDF 改为 BM 25
-
Internal engine级别移除了用于避免同一文档并发更新的竞争锁,带来15%-20%的性能提升
-
提供了第一个Java原生的REST客户端SDK IngestNode
-
提供了 Painless 脚本,代替Groovy脚本
-
新增了Profile API
-
新增了Rollover API
-
新增Reindex
-
引入新的字段类型 Text/Keyword 来替换 String
-
限制索引请求大小,避免大量并发请求压垮 ES
-
限制单个请求的 shards 数量,默认 1000 个
-
仅支持非root用户启动
三、Elasticsearch 6.x
主要特性:
-
基于 Lucene 7.0
-
稀疏性 Doc Values 的支持
Elasticserach 的 doc values 是列式存储,文档的原始值都是存放在 doc values 里面的。稀疏性是指,一个索引里面,文档的结构其实是多样性的,每个列中的每个字段都预留了一个存储空间,如果只有少数文档出现很多字段,则可能会导致磁盘空间的巨大浪费。
Doc Values的优化解决了这个问题,不仅减少了磁盘空间使用量,同时也减少合并时间并