GBase 8a MPP数据分布情况及数据量查看方法

1、查看集群的数据分布规则

可用gccli客户端工具查看:

show nodes;
ip为节点IP地址
name为gnode的节点名
primary part为主数据所在的分片名
duplicate part为备份数据所在的分片名
status为节点状态
datastate为数据分片状态

也可用gcadmin命令查看:

gcadmin showdistribution
Distribution ID为当前所使用的数据分布策略ID号
State为当前ID的状态【new | old】
Total segment num为总分片数
Primary Segment Node IP为该分片的主数据所在的节点IP地址
 Segment ID为数据的分片号
 Duplicate Segment node IP为该分片的备份数据所在的节点IP地址

2.查看指定表数据分布情况

select * from information_schema.CLUSTER_TABLE_SEGMENTS a where table_schema='tpch' and table_name='lineitem';
TABLE_VC为表所在的虚拟集群名
TABLE_SCHEMA为所查看表的所在数据库名
TABLE_NAME为所查看表的表名
SUFFIX为分片名称
HOST为节点IP
TABLE_DATA_SIZE为该分片中纯数据占用的空间大小,单位是byte
TABLE_STORAGE_SIZE 为该分片中纯数据+元数据占用的空间大小,单位是byte
DATA_PERCENT为该分片中纯数据在所有分片中占用量的百分比

因GBase默认带有压缩,故入库后TABLE_DATA_SIZETABLE_STORAGE_SIZE显示的总数据量 < 原数据在文本格式下的文件大小。

表总空间 = 分片大小的总和 * 副本数量,对于复制表就是 * 节点数量。

这里查到的是主分片数据情况,不包括备份数据

3.查看某库总数据量和表的总数据量

select * from information_schema.cluster_tables a where table_schema='tpch' and table_name='lineitem';

查看某表的总数据量

TABLE_SCHEMA为所查看表的所在数据库名
TABLE_NAME为所查看表的表名
CREATE_TIME表的创建时间
TABLE_DATA_SIZE纯数据占用的空间大小,单位是byte
TABLE_STORAGE_SIZE 纯数据+元数据占用的空间大小,单位是byte
TABLE_TYPE表的分布类型
select * from information_schema.cluster_tables a where table_schema='tpch';

查看某库下所有表的总数据量

这里查到的是主分片数据+备分片数据的总容量,一份再除以2就行

  • 9
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值