elasticsearch学习1--需要注意的数据格式

一、String

String类型可以和java的string、mysql的varchar等同,但是为何会分为text、keyword呢?这两者又有什么区别?
ES作为全文检索引擎,它强大的地方就在于分词和倒排序索引。而 text 和 keyword 的区别就在于是否分词(ps:什么叫分词?举个简单例子,“中国我爱你”这句话,如果使用了分词,那么这句话在底层的储存可能就是“中国”、“我爱你”,被拆分成了两个关键字)

1.text–会分词

以“大家好才是真的好”为例,可能会被分词成一个字一个字的。
首先我创建了一个带text类型字段的index
在这里插入图片描述
然后在里面添加数据
在这里插入图片描述
查找数据时可以找到,说明插入数据成功
在这里插入图片描述
使用条件查找value值为“大家好才是真的好”发现找不到
在这里插入图片描述
使用条件查找value值为“大”可以找到,证明已被分词
在这里插入图片描述

2.keyword–不会分词

同样的,我们创建类型为keyword的字段,并存储相同数据
在这里插入图片描述在这里插入图片描述
用完整的value去检索发现可以搜索到了
在这里插入图片描述
相反的部分value检索结果已经为空
在这里插入图片描述
综上所述,keyword类型的数据不会被分词。

二、时间数据类型

date类型数据可以有三种格式

yyyy-MM-dd HH:mm:ss
yyyy-MM-dd
epoch_millis(毫秒值)

并且可以通过format属性,在插入数据时验证date的格式是否符合设定
下面是创建索引并指定date类型数据的格式,然后按照格式插入数据
在这里插入图片描述在这里插入图片描述
当插入数据的类型格式错误时会报错
在这里插入图片描述
另外,format还可以配置多种格式

“format”: “yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis”

三、复杂数据类型

ES的复杂类型有3个,Array、object、nested。

1. Array

在Elasticsearch中,数组不需要专用的字段数据类型。默认情况下,任何字段都可以包含零个或多个值,但是,数组中的所有值都必须具有相同的数据类型。

举例说明:创建一个keyword类型的属性,直接插入数组类型数据,查到的数据就是数组类型的
在这里插入图片描述 在这里插入图片描述 在这里插入图片描述

2.object

大家都知道object代表对象,需要注意的是,object类型的字段,也可以有多个值,形成List的数据结构。

重点:List中的object不允许彼此独立地索引查询。这是什么意思呢?
举个简单例子:我们现在有2条数据:数据结构都是一个List

#第一条数据:[ { “name”:“es6”, “age”:1 }, { “name”:“es7”, “age”:2 } ]
#第二条数据: [ { “name”:“es6”, “age”:2 }, { “name”:“es7”, “age”:1 } ]

如果此时我们的需求是,只要 name = “es6”and “age”= 1 的数据,根据我们常规的理解,只有第一条数据才能被检索出来,但是真的是这样么?我们写个例子看看:
在这里插入图片描述
分别添加上述两条数据
在这里插入图片描述 在这里插入图片描述
查询 name = “es6”and “age”= 1 的数据,结果并不是我们预期的一条
在这里插入图片描述
可以看到两条数据都被我们检索到了。所以,现在理解什么叫做“object不允许彼此独立地索引查询”了吧。就是object没有保证数组中对象的独立性。

但是,我们在日常的使用过程中,常规的需求就是,希望object能被独立的索引,难道es满足不了这个需求么?那是不可能。下面就来看下nested类型。

3.nested

需要建立对象数组的索引并保持数组中每个对象的独立性,则应使用nested数据类型而不是 object数据类型。
在内部,嵌套对象索引阵列作为一个单独的隐藏文档中的每个对象,这意味着每个嵌套的对象可以被独立的查询。
备注:关于nested类型,因为对于nested的应用本身属于ES的高级操作,后面会单独研究并推出nested的使用教程。
对于复杂类型,目前先知道 object和nested类型的区别即可。

四、GEO 地理位置类型

GEO 地理位置类型,分为两种。

地图:Geo-point
形状:Geo-shape

对于web开发,一般常用的是 地图类型 Geo-point。
举例说明Geo-point的定义和查询:
在这里插入图片描述
添加Geo-point类型数据的方式有四种

Geo-point as a object
Geo-point as a string
Geo-point as a geohash
Geo-point as a array

{
  "text": "Geo-point as an object",
  "location": { 
    "lat": 41.12,
    "lon": -71.34
  }
}

{
  "text": "Geo-point as a string",
  "location": "41.12,-71.34" 
}

{
  "text": "Geo-point as a geohash",
  "location": "drm3btev3e86" 
}

{
  "text": "Geo-point as an array",
  "location": [ -71.34, 41.12 ] 
}

四种方式在es中的存储格式
在这里插入图片描述
距离查询:距离某个点方圆200km
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值