Carbondata转csv文件异常处理

最新推荐文章于 2023-05-16 22:37:13 发布

小小Tiny

最新推荐文章于 2023-05-16 22:37:13 发布

阅读量463

点赞数

分类专栏：大数据文章标签： carbondata spark

本文链接：https://blog.csdn.net/gx304419380/article/details/79161163

版权

大数据专栏收录该内容

22 篇文章 1 订阅

订阅专栏

将carbondata数据保存为csv文件，可以通过以下方式操作

/**
     * 将查询结果Dataset保存为csv文件
     * @param sql  查询语句
     * @param path csv存放路径（相对HDFS的路径，例如：/opt/csvFile）
     * @param delimiter csv文件分隔符，默认为逗号 delimiter = ",";
     * @return
     */
    public static boolean exportDatasetAsCSV(String sql, String path, String delimiter) {
        if (StringUtils.isBlank(delimiter)) {
            delimiter = ",";
        }
        if (StringUtils.isNotBlank(path) && StringUtils.isNotBlank(sql)) {
            getSparkSession().sql(sql)
                    .coalesce(1)
                    .write()
                    .option("header", "true")   //是否包含csv头
                    .option("sep ", delimiter)  //分隔符，默认为 ,
                    .mode(SaveMode.Overwrite)
                    .csv(path);
            return true;
        }
        return false;
    }

但是，会报异常： java.lang.NoSuchMethodError: com.univocity.parsers.csv.CsvParserSettings. setUnescapedQuoteEnable

异常原因：

Carbondata自带Univocity-parsers版本为1.5.6，而Spark的univocity-parser版本为2.2.1，二者冲突，并且carbondata的jar包放在了spark_classpath下，这就导致在spark调用csv转换的相关方法时，使用的是carbondata内部的univocity-parser，有些方法在1.5.6中不存在，所以报异常NoSuchMethod。

解决方案：

方法一、将carbondata源码打开，修改Maven依赖，将com.univocity版本锁定为2.2.1，并去除1.5.6的冲突依赖；重新编译替换原来的carbondata即可；

方法二、将com.univocity的2.2.1版本jar包放入spark_classpath中（这个方法不一定好用）