impala
文章平均质量分 73
bsf5521
这个作者很懒,什么都没留下…
展开
-
hive和impala操作parquet文件timestamp带来的困扰
前言:准备使用hive作数据仓库,因历史遗留问题,原先遗留的数据处理都是impala处理的,数据文件是parquet文件,因本身集群资源少,而处理的文件很大,准备使用hive离线分析将小文件推送到db或者impala进行展示操作。准备:搭建cdh5.9,将原有的数据从一个集群迁移到现有的集群。对数据按照天进行动态分区,分区数据仍然使用parquet格式。问题:因分区字段为timestamp原创 2017-05-24 17:40:16 · 3519 阅读 · 0 评论 -
impala的操作
1、-h 外能帮助格式:[root@hadoop-worer1-xiaoyacrm ~]# impala-shell -hUsage: impala_shell.py [options]Options: -h, --help show this help message and exit -i IMPALAD, --impa原创 2017-08-01 11:06:31 · 725 阅读 · 0 评论