0631-6.2-如何确认一个Parquet文件是否被压缩

最新推荐文章于 2024-05-23 17:13:02 发布

Hadoop_SC

最新推荐文章于 2024-05-23 17:13:02 发布

阅读量1.1k

点赞数 1

分类专栏： Hadoop实操

本文链接：https://blog.csdn.net/Hadoop_SC/article/details/101984663

版权

Fayson的github： https://github.com/fayson/cdhproject

推荐关注微信公众号：“Hadoop实操”，ID：gh_c4c535955d0f

1 环境准备

测试环境：

1.CDH6.2
2.集群已开启Kerberos
3.Redhat7.4

1.准备一张文本表，数据文件约6GB。

create table if not exists hive_table_test (
s1 string,
s2 string,
s3 string,
s4 string,
s5 string,
s6 string,
s7 string,
s8 string,
s9 string,
s10 string,
s11 string
) 
ROW FORMAT DELIMITED FIELDS TERMINATED BY "," 
stored as textfile location '/fayson/hive_table_test';

hadoop fs -put hbase_data.csv /fayson/hive_table_test
select * from hive_table_test limit 1;

在这里插入图片描述

在这里插入图片描述
2.创建一张Parquet文件表，然后从文本表将数据插入过去

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Hadoop_SC

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
0631-6.2-如何确认一个Parquet文件是否被压缩

Fayson的github： https://github.com/fayson/cdhproject推荐关注微信公众号：“Hadoop实操”，ID：gh_c4c535955d0f1 环境准备测试环境：1.CDH6.22.集群已开启Kerberos3.Redhat7.41.准备一张文本表，数据文件约6GB。create table if not exists hive_ta...
复制链接

扫一扫