![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
精通要饭
如果能在同龄人中做的更好,为什么不是我呢?
展开
-
关于hive当中表的存储和压缩方式总结
这几天研究hive表的存储方式和压缩模式。在这里做一个简单的总结hive表的存储样例 : 我的表:rp_person_house_loan_info 数据总量:1933776textfile: (1)hive数据表的默认格式,存储方式:行存储 。 (2)可使用Gzip,Bzip2等压缩算法压缩,压缩后的文件不支持split上面的数据存储格...原创 2020-03-12 12:08:30 · 820 阅读 · 0 评论 -
Spark操作Hive分区表
原作者写的比较清楚了,特别是DDL建了表后,又用Spark向表里写数据常常写不进去,会报异常。原文地址:https://dongkelun.com/2018/12/04/sparkHivePatition/前言前面学习总结了Hive分区表,现在学习总结一下Spark如何操作Hive分区表,包括利用Spark DataFrame创建Hive的分区表和Spark向已经存在Hive分区表里插...转载 2019-05-23 10:04:48 · 2504 阅读 · 0 评论