Citus数据分片分布研究(一 在工作节点直接操作表)

(本文中凡是未显式指出的SQL,均在协调节点上执行)

工作节点

mydb1=# SELECT * FROM master_get_active_worker_nodes();
   node_name   | node_port 
---------------+-----------
 192.168.7.131 |      5432
 192.168.7.135 |      5432
 192.168.7.136 |      5432
 192.168.7.137 |      5432
 192.168.7.133 |      5432
 192.168.7.132 |      5432
 192.168.7.134 |      5432
 192.168.7.130 |      5432
(8 rows)

创建表test_table

create table test_table(id int, name varchar(16));

此时在协调节点上用 \d 可以看到表test_table。

配置分片原则

SELECT master_create_distributed_table('test_table', 'id', 'hash');

根据分片数和副本数进行分片

SELECT master_create_worker_shards('test_table', 8, 1);

此时在工作节点上用 \d 可以看到表test_table_XXXXXX。

查看分片

mydb1=# SELECT * from pg_dist_shard;
 logicalrelid | shardid | shardstorage | shardminvalue | shardmaxvalue 
--------------+---------+--------------+---------------+---------------
 test_table   |  102024 | t            | -2147483648   | -1610612737
 test_table   |  102025 | t            | -1610612736   | -1073741825
 test_table   |  102026 | t            | -1073741824   | -536870913
 test_table   |  102027 | t            | -536870912    | -1
 test_table   |  102028 | t            | 0             | 536870911
 test_table   |  102029 | t            | 536870912     | 1073741823
 test_table   |  102030 | t            | 1073741824    | 1610612735
 test_table   |  102031 | t            | 1610612736    | 2147483647
(8 rows)

可见,工作节点上的表名test_table_XXXXXX中最后的一段数字,即是这里的shardid。

操作表test_table

mydb1=# INSERT INTO test_table VALUES(1,'a');
INSERT 0 1
mydb1=# INSERT INTO test_table VALUES(2,'b');
INSERT 0 1
mydb1=# INSERT INTO test_table VALUES(3,'c');
INSERT 0 1
mydb1=# INSERT INTO test_table VALUES(4,'d');
INSERT 0 1
mydb1=# INSERT INTO test_table VALUES(5,'e');
INSERT 0 1
mydb1=# INSERT INTO test_table VALUES(6,'f');
INSERT 0 1
mydb1=# INSERT INTO test_table VALUES(7,'g');
INSERT 0 1
mydb1=# INSERT INTO test_table VALUES(8,'h');
INSERT 0 1
mydb1=# select * from test_table;
 id | name 
----+------
  1 | a
  8 | h
  5 | e
  4 | d
  7 | g
  3 | c
  6 | f
  2 | b
(8 rows)

在工作节点上直接操作表

在worker node上执行:

mydb1=# select * from test_table_102024;
 id | name 
----+------
  1 | a
  8 | h
(2 rows)

可见表test_table的记录是根据id列hash散布在8个工作节点中的。
尝试直接向工作节点插入数据,在worker node上执行:

mydb1=# INSERT INTO test_table_102024 VALUES(999,'999');
INSERT 0 1

然后再进行查询:

mydb1=# select * from test_table_102024;
 id  | name 
-----+------
   1 | a
   8 | h
 999 | 999
(3 rows)

在协调节点coordinator node上进行查询:

mydb1=# select * from test_table;
 id  | name 
-----+------
   1 | a
   8 | h
 999 | 999
   5 | e
   4 | d
   7 | g
   3 | c
   6 | f
   2 | b
(9 rows)

可见直接对工作节点进行的数据操作,可以在协调节点正常访问(但是没按照id进行哈希分布)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

皓月如我

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值