Hive基础篇—02

Hive的数据模型

        分区

                根据某些条件,划分数据,将数据划分成一个一个的文件夹存储

                根据虚拟的字段划分

        分桶

                提高针对某些字段的查询效率

                根据某个字段进行hash计算然后%分桶的个数,确定这个数据在哪个桶里

                后续在查询的时候,就可以直接在对应的桶里检索,减少检索范围,提高查询效率

Decimal

        对精确度要求比较高的场景

                一般用于金额

                经纬度的使用

varchar 和 char的区别是什么

        varchar(32)可变,存储的数据长度可变

        char(32) 固定长度,存储的数据长度固定

         应用场景

                位数不确定的时候用varchar

                位数确定一般用char

        char性能更好

        char存储的时候是整齐的

        如果长度相等,char的空间利用率更高,因为varchar需要有一个额外字段存储长度的

truncate

        意思为截断表

        作用是清空表所有信息

                截断表之后重新填写数据,id从1开始

 字节数组

binary

字节数组类型,可以存储任意类型的数据用的很少

复杂(集合)数据类型

数据类型

描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值