Spark SQL
Spark SQL
嘻哈吼嘿呵
这个作者很懒,什么都没留下…
展开
-
SparkSql 中支持的sql语句、函数等
Spark SQL, Built-in Functions原创 2019-10-27 03:24:16 · 1199 阅读 · 0 评论 -
Spark之数据倾斜调优
一 调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜问题,以保证Spark作业的性能。1.1数据倾斜发生时的现象 绝大多数task执行得都非常快,但个别task执行极慢。比如,总共有1000个task,997个task都在1分钟之内执行完了,但是剩余两三个task...转载 2019-09-06 19:48:17 · 165 阅读 · 0 评论 -
Spark行变列
val df = originalDF .selectExpr("room_id", "from_id", "if(gender is null or gender ='',null,gender) as gender") println("==========行变列=======") val genders = List(0, 1, ...原创 2019-09-06 11:55:52 · 111 阅读 · 0 评论 -
Spark SQL重点知识总结
一、Spark SQL的概念理解Spark SQL是spark套件中一个模板,它将数据的计算任务通过SQL的形式转换成了RDD的计算,类似于Hive通过SQL的形式将数据的计算任务转换成了MapReduce。Spark SQL的特点:1、和Spark Core的无缝集成,可以在写整个RDD应用的时候,配置Spark SQL来完成逻辑实现。2、统一的数据访问方式,Spark SQL提供标...转载 2019-09-05 21:01:11 · 881 阅读 · 0 评论