一、String
String类型可以和java的string、mysql的varchar等同,但是为何会分为text、keyword呢?这两者又有什么区别?
ES作为全文检索引擎,它强大的地方就在于分词和倒排序索引。而 text 和 keyword 的区别就在于是否分词(ps:什么叫分词?举个简单例子,“中国我爱你”这句话,如果使用了分词,那么这句话在底层的储存可能就是“中国”、“我爱你”,被拆分成了两个关键字)
1.text–会分词
以“大家好才是真的好”为例,可能会被分词成一个字一个字的。
首先我创建了一个带text类型字段的index
然后在里面添加数据
查找数据时可以找到,说明插入数据成功
使用条件查找value值为“大家好才是真的好”发现找不到
使用条件查找value值为“大”可以找到,证明已被分词
2.keyword–不会分词
同样的,我们创建类型为keyword的字段,并存储相同数据
用完整的value去检索发现可以搜索到了
相反的部分value检索结果已经为空
综上所述,keyword类型的数据不会被分词。
二、时间数据类型
date类型数据可以有三种格式
yyyy-MM-dd HH:mm:ss
yyyy-MM-dd
epoch_millis(毫秒值)
并且可以通过format属性,在插入数据时验证date的格式是否符合设定
下面是创建索引并指定date类型数据的格式,然后按照格式插入数据
当插入数据的类型格式错误时会报错
另外,format还可以配置多种格式
“format”: “yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis”
三、复杂数据类型
ES的复杂类型有3个,Array、object、nested。
1. Array
在Elasticsearch中,数组不需要专用的字段数据类型。默认情况下,任何字段都可以包含零个或多个值,但是,数组中的所有值都必须具有相同的数据类型。
举例说明:创建一个keyword类型的属性,直接插入数组类型数据,查到的数据就是数组类型的
2.object
大家都知道object代表对象,需要注意的是,object类型的字段,也可以有多个值,形成List的数据结构。
重点:List中的object不允许彼此独立地索引查询。这是什么意思呢?
举个简单例子:我们现在有2条数据:数据结构都是一个List
#第一条数据:[ { “name”:“es6”, “age”:1 }, { “name”:“es7”, “age”:2 } ]
#第二条数据: [ { “name”:“es6”, “age”:2 }, { “name”:“es7”, “age”:1 } ]
如果此时我们的需求是,只要 name = “es6”and “age”= 1 的数据,根据我们常规的理解,只有第一条数据才能被检索出来,但是真的是这样么?我们写个例子看看:
分别添加上述两条数据
查询 name = “es6”and “age”= 1 的数据,结果并不是我们预期的一条
可以看到两条数据都被我们检索到了。所以,现在理解什么叫做“object不允许彼此独立地索引查询”了吧。就是object没有保证数组中对象的独立性。
但是,我们在日常的使用过程中,常规的需求就是,希望object能被独立的索引,难道es满足不了这个需求么?那是不可能。下面就来看下nested类型。
3.nested
需要建立对象数组的索引并保持数组中每个对象的独立性,则应使用nested数据类型而不是 object数据类型。
在内部,嵌套对象索引阵列作为一个单独的隐藏文档中的每个对象,这意味着每个嵌套的对象可以被独立的查询。
备注:关于nested类型,因为对于nested的应用本身属于ES的高级操作,后面会单独研究并推出nested的使用教程。
对于复杂类型,目前先知道 object和nested类型的区别即可。
四、GEO 地理位置类型
GEO 地理位置类型,分为两种。
地图:Geo-point
形状:Geo-shape
对于web开发,一般常用的是 地图类型 Geo-point。
举例说明Geo-point的定义和查询:
添加Geo-point类型数据的方式有四种
Geo-point as a object
Geo-point as a string
Geo-point as a geohash
Geo-point as a array
{
"text": "Geo-point as an object",
"location": {
"lat": 41.12,
"lon": -71.34
}
}
{
"text": "Geo-point as a string",
"location": "41.12,-71.34"
}
{
"text": "Geo-point as a geohash",
"location": "drm3btev3e86"
}
{
"text": "Geo-point as an array",
"location": [ -71.34, 41.12 ]
}
四种方式在es中的存储格式
距离查询:距离某个点方圆200km