1.概述
数据分区(partition)和数据分片(shard)是完全不同的两个概念。
数据分区是针对本地数据而言的,是数据的一种纵向切分。
而数据分片是数据的一种横向切分。
数据分区对于一款OLAP数据库而言意义非凡:借助数据分区,在后续的查询过程中能够跳过不必要的数据目录,从而提升查询的性能。合理地利用分区特性,还可以变相实现数据的更新操作,因为数据分区支持删除、替换和重置操作。
假设数据表按照月份分区,那么数据就可以按月份的粒度被替换更新。分区虽好,但不是所有的表引擎都可以使用这项特性,目前只有合并树(MergeTree) 家族系列的表引擎才支持数据分区
。接下来通过一个简单的例子演示分区表的使用方法。首先由PARTTIONBY指定分区键,并将其格式化为年月的形式。
2.案例