Hive的数据模型
分区
根据某些条件,划分数据,将数据划分成一个一个的文件夹存储
根据虚拟的字段划分
分桶
提高针对某些字段的查询效率
根据某个字段进行hash计算然后%分桶的个数,确定这个数据在哪个桶里
后续在查询的时候,就可以直接在对应的桶里检索,减少检索范围,提高查询效率
Decimal
对精确度要求比较高的场景
一般用于金额
经纬度的使用
varchar 和 char的区别是什么
varchar(32)可变,存储的数据长度可变
char(32) 固定长度,存储的数据长度固定
应用场景
位数不确定的时候用varchar
位数确定一般用char
char性能更好
char存储的时候是整齐的
如果长度相等,char的空间利用率更高,因为varchar需要有一个额外字段存储长度的
truncate
意思为截断表
作用是清空表所有信息
截断表之后重新填写数据,id从1开始
字节数组
binary |
字节数组类型,可以存储任意类型的数据用的很少 |
复杂(集合)数据类型
数据类型 |
描述 |