在这里插入代码片
一:数仓搭建图谱
二:Spark配置lzo压缩 直接执行lzo压缩即可使用spark-sql完美支持数仓 问题 spark-sql运行时产生200个并行任务,也就是落地200个文件。文件太小时需调参数。数仓结合数据量是否适合用spark.
spark.driver.extraClassPath /opt/module/hadoop-2.7.2/share/hadoop/common/hadoop-lzo-0.4.20.jar
spark.executor.extraClassPath /opt/module/hadoop-2.7.2/share/hadoop/common/hadoop-lzo-0.4.20.jar
数仓项目
最新推荐文章于 2023-03-03 20:19:32 发布