大数据Spark(二十六):SparkSQL数据处理分析
两种方式底层转换为RDD操作,包括性能优化完全一致,在实际项目中语句不通的习惯及业务灵活选择。无论哪种方式,都是相通的,必须灵活使用掌握。上述函数在实际项目中经常使用,尤其数据分析处理的时候,其中要注意,调用函数时,通常指定某个列名称,传递Column对象,通过。,将DataFrame/Dataset注册为临时视图或表,编写SQL语句,类似HiveQL;,调用DataFrame/Dataset API(函数),类似RDD中函数;调用DataFrame/Dataset中API(函数)分析数据,其中函数包含。
复制链接