doc es 中type_ES学习笔记系列

本文介绍了ES作为大数据组件的基本概念,包括ES集群、节点、分片以及核心类型。详细阐述了ES的类型,如字符串、数值型、数组和预定义字段。同时,探讨了ES的查询和索引过程,强调了分析器在索引过程中的作用以及不同索引选项的影响。
摘要由CSDN通过智能技术生成

    ES作为大数据的组件,使用的范围越来越广,相关配套也越来越好。本文将对自己在ES学习中碰见的问题进行基本的介绍。

ES的组成

70cd72b8ca98fdcd8ca494f3a974d6f6.png

01

01

ES集群

    ES集群指的是多台ES服务器,也就是多个节点

02

01

ES节点

    一个节点就是一个ES服务器

03

01

ES分片

    分片一般指的是索引的分片,一个索引有多个分片,分片分为主分片和副分片。分片分部在不同的节点上。一个分片就是一个Lucene索引。

04

01

ES概论解析

    索引-index相当于关系数据库,文档-Type相当于表,文档-Doc相当于行,Field相当于列,映射Mapping相当于Schema约束。

0e8c239cdb73085b9d45aca5c5ddc7db.png

ES的类型

01

01

核心类型

    字符串和数值型

02

01

数组和多元字段

    主要是在某个字段存储相同核心类型的多个值。比如多个标签

03

01

预定义字段

  1. _ttl文档的存活时间

  2. _timestamp 索引文档索引的日期

  3. _source 控制文件存储的,存储原始Json,后期使用更新API更新文档的内容时候有用,_source其实是Lucene的存储字段

  4. _all  索引所有字段,可以设置哪个字段不被_all包含。

  5. _uid 文档类型type和ID的结合体

  6. _id   识别文档,没有被索引

  7. _type 识别文档,被索引

  8. _index 识别文档

  9. _size 索引原始JSON内容的大小

  10. _routing 控制文档路由

  11. _parent 

ES的查询和索引过程

b237bb376420a9280f56d13f46ed2782.png

01

01

ES的查询

    一个查询提交后,会同时向一个索引的多个分片进行查询,分布式查询;查询的结果会整合返回,如上图所示。

02

01

ES的索引过程

   当文件被插入时,需要经过分析器,分析器对插入的文档进行分词,建立词条,在分析的过程中词全部转换为小写。

   文档插入时,有一个索引(index)选项,index选项值,analyzed,not_analyzed和no:

  1. 其中analyzed是默认值,分析器将所有的字符转换为小写,并且分解为单词。

  2. not_analyzed表示分析过程会被忽略,整个字符串被当做单独的词条。

  3. no表示没有词条,被忽略。

37e911208ee27af9e6b5dd5ebbd93500.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值