目录
15.SparkSQL中RDD、DataFrame、DataSet三者的转换
16.请列举会引起Shuffle过程的Spark算子,并简述功能
17.当Spark涉及到数据库的操作时,如何减少Spark运行中的数据库连接数?
29.Spark Streaming有哪几种方式消费Kafka中的数据,她们之间的区别是什么?
30.简述SparkStreaming窗口函数的原理(重点)
目录
15.SparkSQL中RDD、DataFrame、DataSet三者的转换
16.请列举会引起Shuffle过程的Spark算子,并简述功能
17.当Spark涉及到数据库的操作时,如何减少Spark运行中的数据库连接数?
29.Spark Streaming有哪几种方式消费Kafka中的数据,她们之间的区别是什么?
30.简述SparkStreaming窗口函数的原理(重点)