elasticsearch有各种core-type,另外还有各种复杂结构,比如nested,child-parent等。
array是一种常用的类型。在es中array是默认支持的,并不存在单独的一个type=array。当你插入数据带有“[]”的时候,这个field就成为array。
一般建立索引是采用bulk+prepareindex的方式完成的,检索出需要建立索引的数据,然后index。数组的话就带上方括号。很方面。
但是现实项目中由于各种数据模型的限制并不能直接运用上面简易的方式进行。下面是一种应用场景:
1:一行关系型数据库中的数据被打散了,各个field知道属于那一个id(显然这个id不能由es自动生成,而是规定好的)
2:一行数据也不是顺序过来的,字段也是无序过来的。
3:可以从一张单独的表中获取所有id。
现在要把以前的一行记录完整的索引起来,es中的id就采用1中描述的id,各字段作为es的field。
显然最简单的索引方法不适用与这个应用场景,但是采用bulk的方式是肯定的,要不然效率太低。
首先想到的是es提供的partital-update的方法,用setDoc+upsert来实现,看起来没什么问题,但是如果是array类型,问题出现了:
“The update API also support pa