当我们希望可以把一部分数据索引到相同分片的时候,或者只需要查询这部分数据的时候,会用到ES的路由功能。
本文是在ES的插件sense上操作试验。
1. 新建索引
PUT test-1
{
"settings": {
"number_of_replicas": 0,
"number_of_shards": 2
}
}
复制代码
通过以下命令查看,可以看到集群总共2台机器,IP分别为10.2.75.236和10.2.75.235。每台机器上存储一个分片。
GET /_cat/shards/test-1?v
复制代码
2. 通过路由写入数据
POST test-1/doc?routing=A
{
"name":"num 1"
}
复制代码
按照以上命令,依次在routing=A时写入4条记录,routing=B时写入2条记录,通过查看分片,可以看到分片1上有4条记录,分片0上有2条记录。由此可以推断分片1对应路由A,分片0对应路由B。
通过以下查询操作可以验证以上结论。
GET test-1/_search?routing=A
GET test-1/_search?routing=B
复制代码
3. 指定分片
可以通过以下命令,创建一个虚拟索引(别名),并指定查询和写入的路由
PUT test-1/_alias
{
"actions":{
"add":{
"index":"test-1",
"alias":"test",
"search_routing":"b",
"index_routing":"a"
}
}
}
复制代码
search_routing表示查询路由,index_routing表示写入路由,即查询操作只会读取路由B对应分片0,写入操作只会写入路由A对应分片1。
4. Tips
-
路由确保拥有相同路由值的文档被索引到相同的分片上。一个给定的分片上可以有很多拥有不同路由值的文档。
继续写入routing=C的两条记录,可以看到记录被写入分片1,此时分片1存在两个routing值:A和C。
-
search_routing可以查询多个路由值,index_routing只能对应一个路由值