1、WHY
1)、大规模的数据检索应该怎么做?
2)、怎么样避免单点故障
3)、如何保证数据安全性,热备、冷备、异地多活
ES 应运而生,ES 是开源高扩展的分布式全文检索引擎,可以实现近乎实时的查询,检索数据;本身扩展性非常好,可以扩展
到上百态服务器,处理PB级别的数据。所以学习ES 是很有必要的。
2、HOW
如果去学习:
1)、了解原理
2)、熟悉DSL
3)、安装应用
2.1、基本原理
总结一句话 面向文档,分片来解决多点存储,副本来保证可用性,写时先写buffer内存,1秒flash到磁盘。filter查询实时查内
存数据,filter查询可缓存,精确过滤。master适用全局索引,分值匹配。查询慢且不缓存。
2.1.1、面向文档
ES 面向文档存储,就没必要将对象扁平化存入表格。它可以存储整个对象或文档。ES不仅存储文档,而且索引每个文档的
内容,使之可以被检索。在ES中,我们对文档进行索引、检索、排序和多虑,而不是对行列数据。ES使用JSON作为文档的序列
号方式。
2.1.2、文档类型(Type)
类比传统的关系型数据库领域来说,类型相当于“表”。类型是索引内部的逻辑分区(category/partition),然而其意义完全取决
于用户需求。一个索引内部可定义一个