ElasticSearch
大师兄你家猴跑啦
主要Java 、spark 、大数据技术
展开
-
ElasticSearch跨版本数据升级1.4.1-2.4.1
需求:Es版本数据升级:1.4.1-2.4.11.4.1 版本数据200W条数据;[root@dmp9 wangzhanpeng]# curl dmp9:9201/_cat/indices?vhealth status index pri rep docs.count docs.deleted store.size pri.store.size green open wzp...原创 2018-11-27 16:01:31 · 717 阅读 · 0 评论 -
elasticsearch-migration 跨集群数据迁移
这个工具正好srcoll+bulk原理,进行数据迁移,该工具安装简单,解压即可使用。scroll查询:es深度分页查询,基于http请求,可以查询索引下所有数据,不会有from+size不能大于1w的问题。bulk请求:可以批量插入数据,是http请求。1、下载文件 elasticsearch-migration源码:https://github.com/medcl/esm-abando...原创 2018-11-27 16:11:55 · 4349 阅读 · 0 评论 -
ElasticSearch 升级过程中给涉及到的术语-1、同步刷新synced flush
Es 会跟踪每个活动分片的索引,分片在五分钟内如果没有收到任何有关索引的操作,则认为分片不活动了;这将给Es机会去减小分片的资源,同时执行一种特殊刷新,成为:同步刷新;同步刷新也是执行普通的刷新,然后给所有的分片添加一个不同的标记; 当没有索引操作时,id 标记会添加到分片上。标记可以作为一个快速的方式来检查两个分片的lucene索引一致是否一致;这种快速的id 比较主要用于 数据恢复...翻译 2018-11-27 17:07:46 · 2549 阅读 · 0 评论 -
ElasticSearch 升级过程中给涉及到的术语-2、API cat recovery
ceshi翻译 2018-11-27 18:29:22 · 731 阅读 · 0 评论 -
ElasticSearch 升级过程中给涉及到的术语-3 事务日志-Translog
1、事务日志介绍 只有在luncene commit以后,luncene的改变才会被持久化,这是一个相对开销很大的操作,因而不能在每个索引后或者删除操作后执行;在一次提交之后和另一次提交之前发生的更改将在进程退出或硬件故障的情况下由Lucene从索引中删除。由于luncene commit 开销太大而不能在每次操作后执行,因此每个分片的copy都有一个事物日志,这个事物日志成...翻译 2018-11-28 16:37:42 · 1929 阅读 · 5 评论