Elasticsearch Mapping

最新推荐文章于 2024-08-11 11:22:23 发布

liushengbin3046

最新推荐文章于 2024-08-11 11:22:23 发布

阅读量97

点赞数

原文链接：https://www.cnblogs.com/cjsblog/p/10035629.html

版权

1. Mapping（映射）

Mapping 是定义文档及其包含的字段是如何存储和索引的过程

例如，我们用映射来定义：

哪些字符串字段应该被当做全文字段
哪些字段包含数字、日期或地理位置
是否应该将文档中所有字段的值索引到catch-all字段中

1.1. Mapping Type（映射类型）

每个索引都有一个映射类型，以决定文档将被如何索引

映射类型包含两部分：

Meta-fields

　　Meta-fields通常用于自定义文档的元数据。例如，meta-fields包括文档的 _index， _type， _id， _source等字段

Fields 或 properties

　　一个映射类型包含一个字段列表或属性列表

1.2. Field datatypes（字段数据类型）

每个字段有一个数据类型，它可以是下列之一：

简单类型，比如 text， keyword， date， long， double， boolean ， ip
支持JSON层级结构的类型，比如 object 或者 nested
特别的类型，比如 geo_point， geo_shape， completion

1.3. Example mapping

复制代码

curl -X PUT "localhost:9200/my_index" -H 'Content-Type: application/json' -d'
{
    "mappings": {
        "doc": { 
            "properties": { 
                "title":    { "type": "text"  }, 
                "name":     { "type": "text"  }, 
                "age":      { "type": "integer" },  
                "created":  {
                    "type":   "date", 
                    "format": "strict_date_optional_time||epoch_millis"
                }
            }
        }
    }
}
'

复制代码

创建一个索引名字叫“my_index”，并且添加一个映射类型叫“doc”，包含4个字段

2. Field datatypes（字段类型）

2.1. 核心类型

字符串类型

　　text ， keyword

数值类型

　　long ， integer ， short ， byte ， double ， float ， half_float ， scaled_float

日期类型

　　date

布尔类型

　　boolean

二进制类型

　　binary

范围类型

　　integer_range ， float_range ， long_range ， double_range ， date_range

2.2. 复杂类型

数组类型

　　数组不需要一个专门的类型

对象类型

　　object （PS：单个JSON对象）

内嵌类型

　　nested（PS：JSON对象数组）

2.3. 地理类型

Geo_point类型

　　geo_point 用于地理位置经纬度坐标

Geo_shape类型

　　geo_shape 用于复杂形状

2.4. 专门的数据类型

IP类型

　　ip （用于IPv4和IPv6地址）

Completion类型

　　completion （用于自动补全提示）

Token count 类型

　　token_count （用于计数字符串中的token）

mapper-murmur3

　　murmur3 （计算值的hashcode，并将其存储到索引中）

过滤器类型

　　接受一个查询语句

join 类型

　　为同一索引内的文档定义父/子关系

3. Meta-fields（元数据字段）

每个文档都有与之关联的元数据

3.1. 标识元数据字段

　　_index　　文档属于哪个索引

　　_id　　　文档ID

　　_type　　文档的映射类型

　　_uid　　　由 _type和 _id组成的一个组合字段

3.2. 文档来源元数据字段

　　_source　　文档的原始JSON

　　_size　　　 _source字段的长度（多少字节）

3.3. 索引元数据字段

　　_all　　　　索引其它字段的值，默认情况下是禁用的

　　_field_names　　所有非空字段

3.4. 路由元数据字段

　　_routing　　一个自定义的路由值，用于分片的

3.5. 其它元数据字段

　　_meta　　　其它

4. 小结

如果把Elasticsearch比作关系型数据库的话，那么，映射就是建表，映射类型就是存储引擎，字段类型就是字段类型

liushengbin3046

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Elasticsearch Mapping

1. Mapping（映射）Mapping 是定义文档及其包含的字段是如何存储和索引的过程例如，我们用映射来定义：哪些字符串字段应该被当做全文字段哪些字段包含数字、日期或地理位置是否应该将文档中所有字段的值索引到catch-all字段中1.1.Mapping Type（映射类型）每个索引都有一个映射类型，以决定文档将被如何索引映射类型包含两部分：Meta-f...
复制链接

扫一扫