elasticsearch文档索引API(二)，2024年Java知识体系总结

最新推荐文章于 2024-07-30 07:27:30 发布

程序员锋范

最新推荐文章于 2024-07-30 07:27:30 发布

阅读量836

点赞数 23

分类专栏： Java程序员文章标签： elasticsearch java jenkins

本文链接：https://blog.csdn.net/weixin_58134620/article/details/136793505

版权

Java程序员专栏收录该内容

9 篇文章 0 订阅

订阅专栏

{

“user” : “kimchy”,

“post_date” : “2009-11-15T14:12:12”,

“message” : “trying out Elasticsearch”

}

’

在type后面有一个1表示文档的id，这个id也可以不写，不写默认会自动生成id，请求如下：

curl -X POST “localhost:9200/twitter/_doc?pretty” -H ‘Content-Type: application/json’ -d’

{

“user” : “kimchy”,

“post_date” : “2009-11-15T14:12:12”,

“message” : “trying out Elasticsearch”

}

’

在这个请求中，op_type会被自动设置为create，执行结果如下：

640?wx_fmt=png

可以看到，此时生成的id是一个字符串。

路由机制

====

Elasticsearch是一个分布式系统，当一个文档要被索引时，该文档会被索引到系统中的某一个分片上，那么到底是哪一个分片呢？在elasticsearch文档读写模型一文中，我们简单介绍过这个话题，但是没有深入探究，这里，就和读者一起来探讨下Elasticsearch中的路由机制。

分片位置的计算公式如下：

position=hash(routing) % numberofprimary_shards

在这里，routing是一个任意字符串，Elasticsearch默认是将文档的id作为routing值，通过hash函数计算后，生成一个数字，这个数字再和主分片的总数取余，得到一个处于 [0,number_of_primary_shards-1]区间内的数，该数字就是该文档所在的分片。基于这样的映射模式，Elasticsearch不支持索引创建成功后，修改分片数量，即分片数量要一开始就确定好，以后不能修改，否则会导致之前计算出来的position失效（即查找时找不到之前的文档，因此numberofprimary_shards已经变了）。

默认情况下，这种路由机制会通过id将文档平均分配在所有的分片上，这也导致了Elasticsearch无法确定一个文档的具体位置，当有查询请求时，它需要将查询请求广播到所有分片上去执行，这无疑降低的查询的效率，对于这个问题，读者可以使用自定义路由模式去解决，如下请求：

curl -X POST “localhost:9200/twitter/_doc/1?pretty&routing=sang” -H ‘Content-Type: application/json’ -d’

{

“user” : “kimchy”,

“post_date” : “2009-11-15T14:12:12”,

“message” : “trying out Elasticsearch”

}

’

开发者在添加文档时指定路由，在查询的时候也指定路由，这样就可以避免Elasticsearch向所有的分片发送查询请求，减少系统资源的消耗，查询请求如下：

curl -X GET “localhost:9200/twitter/_search?pretty&routing=sang”

不过这种方式又会带来另外一个问题，即路由相同的文档总是被分在同一个分片上，无法做到将文档平均分配在不同的分片上，因此，两种不同的方式，需要读者在开发中根据实际需求进行取舍。

分布式