- impala创建的数据放在哪里?
impala没有自己的文件系统,所以impala建的表,都放在hdfs文件系统上。而且根据创建表使用的参数不同,文件的格式也可以不相同。
一般来说,create table不加特殊参数的话,建成的表将是一个txt文件。
根据cloudera的推荐,最适合的格式还是Parquet table. 如果有可能,为了提高性能 ,还是需要把数据从txt转换成列式存储的形式。
运行 DESCRIBE FORMATTED table_name 可以了解数据表的实际格式。
This can be a useful technique to see how Impala represents special values within a text-format data file. Use the DESCRIBE FORMATTED statement to see the HDFS directory where the data files are stored, then use Linux commands such as hdfs dfs -ls hdfs_directory and hdfs dfs -cat hdfs_file to display the contents of an Impala-created text file.