Hive系列二 数据类型和文件格式

Hive 支持关系型数据库的绝大多数 基本数据类型 ,同时也支持 4 集合数据类型
基本数据类型及转换
集合数据类型
文本文件数据编码
Hive 表中的数据在存储在文件系统上, Hive 定义了默认的存储格式,也支持用户自 定义文件存储格式。
Hive 默认使用几个很少出现在字段值中的控制字符,来表示替换默认分隔符的字符。
Hive 默认分隔符
默认的分隔导致可读性极差
 
 
读时模式
在传统数据库中,在加载时发现数据不符合表的定义,则拒绝加载数据。数据在写入数据库时对照表模式进行检查,这种模式称为" 写时模式 " schema on write )。
写时模式 -> 写数据检查 -> RDBMS
Hive 中数据加载过程采用 " 读时模式 " (schema on read) ,加载数据时不进行数据格式的校验,读取数据时如果不合法则显示NULL 。这种模式的优点是加载数据迅速。
读时模式 -> 读时检查数据 -> Hive;好处:加载数据快;问题:数据显示NULL
 
类型转换:
隐式转换
 
显示转换  使用 cast 函数进行强制类型转换;如果强制类型转换失败,返回 NULL
 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值