由于在ES中,所有单个文档的增删改都是原子性的操作,因此将相关的实体数据都储存在同一个文档是很好的,且由于所有信息都在一个文档中,因此当我们查询时就没有必要像mysql一样去关联很多张表,只要搜一遍文档就可以查出所有需要的数据,查询效率非常高
因此除了基本数据类型之外,ES也支持使用复杂的数据类型,像是数组、内部对象,而要使用内部对象的话,需要使用nested来定义索引,使文档内可以包含一个内部对象
。
为什么不用object而要使用nested来定义索引的原因是:obejct类型会使得内部对象的关联性丢失
这是因为Lucene底层其实没有内部对象的概念,所以ES会利用简单的列表储存字段名和值,将object类型的对象层次摊平,再传给Lucene
假设user类型是object,当插入一笔新的数据时,ES会将他转换为下面的内部文档,其中可以看见alice和white的关联性丢失了
PUT 127.0.0.1/mytest/doc/1
{
"group": "fans",
"user": [
{ "first": "John", "last": "Smith" },
{ "first": "Alice", "last": "White" }
]
}
转换后的内部文档:
{
"group": "fans",
"user.first": [ "alice", "john" ],
"user.last": [ "smith", "white" ]
}
因此导致查询时出现意想不到的结果。
nested类型就是为了解决object类型在对象数组上丢失关联性的问题的,如果将字段设置为nested类型,那个每一个嵌套对象都会被索引为一个 "隐藏的独立文档"。
-
由于嵌套文档直接储存在文档内部,因此查询时嵌套文档和根文档的联合成本很低,速度和单独储存几乎一样
-
但是要注意,查询的时候返回的是整个文档,而不是嵌套文档本身,并且如果要增删改一个嵌套对象,必须把整个文档重新索引才可以。