分区:partition
创建一个分区表
create table 表名称(
字段信息
)
PARTITIONED BY(
分区名称1 数据类型 COMMENT '注释:可不写',
分区名称2 数据类型 COMMENT '注释:可不写',
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '字段之间分割符'
LINES TERMINATED BY '\n'
举个例子:
需求:查询某个月份某个城市的住房信息(这种情况不可能每个月份每个城市都创建一个表所以需要给一个表分区来存储不同情况的信息)
解决:
(1):
分区1 存月份信息
分区2 城市区信息
(2):
将不同的数据文件存储到对应的分区
LOAD DATA LOCAL INPATH '数据文件存储路径' INTO TABLE 表名称 PARTITION (分区1="例:5月", 分区2="例:上海")
注释:添加数据的时候 会自动将 分区1=“例:5月” 这一块(也就是分区信息)作为目录名称创建目录
分区表是如何分析数据 (例:分析上海3月分的数据:
分析:
上海,03月份数据
select
需要的字段
from
表名称
where
分区1名称=03 and 分区2名称=上海