Impala使用手册

  • impala创建的数据放在哪里?

impala没有自己的文件系统,所以impala建的表,都放在hdfs文件系统上。而且根据创建表使用的参数不同,文件的格式也可以不相同。

一般来说,create table不加特殊参数的话,建成的表将是一个txt文件。

根据cloudera的推荐,最适合的格式还是Parquet table. 如果有可能,为了提高性能 ,还是需要把数据从txt转换成列式存储的形式。

运行 DESCRIBE FORMATTED table_name 可以了解数据表的实际格式。

This can be a useful technique to see how Impala represents special values within a text-format data file. Use the DESCRIBE FORMATTED statement to see the HDFS directory where the data files are stored, then use Linux commands such as hdfs dfs -ls hdfs_directory and hdfs dfs -cat hdfs_file to display the contents of an Impala-created text file.

转载于:https://my.oschina.net/pearma/blog/817287

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值