CTAS就是create table as select的简称。
最近在使用SparkSQL来进行快速的自定义SQL分析,因为需要把分析的结果保存下来,所以一定要使用CTAS功能,然而在使用的时候发现了一个bug,当然这个bug已经被报告了,状态依然是unresolved
我们用的spark2.2.1版本
bug 详情:
https://issues.apache.org/jira/browse/SPARK-21067
https://issues.apache.org/jira/browse/SPARK-16825
解决方法:
指定 hive 输出文件格式
SET hive.default.fileformat = Parquet;