1.hive分区与Bucket的畏难情绪
刚刚开始学习,这个的时候,一直感觉他比较难,看名字就觉得不好理解,但是实际上学起来超级简单。
##2.出现背景
这个东西为什么出来呢?来看一个需求,技术的的出现总是因为有了需求才会诞生的。
假设我们有数据宾馆的近10年的数据,格式如下
每列的意义
| hotel | | |
| h_id | id |
| | h_region | 旅馆行政区划 |
| | h_hname | 旅馆名称 |
| | h_address | 旅馆地址 |
| | h_uname | 姓名 |
| | h_code | 证件号码 |
| | h_start | 开房时间 |
| | h_end | 退房时间 |
| | h_start_m | 开房时间时间戳 |
| | h_end_m | 退房时间时间戳 |
| |