df操作
show() 将数据按照表格的方式打印出来,也可以添加参数,返回若干条数据
collect() 获取所有数据到Array 返回Array对象
collectAsList() 获取所有数据到List 返回List对象
查询指定字段
select("字段名","字段名").show()
可以做数学运算
select(col("字段名"),col("字段名"),col
Spark SQL 学习笔记(更新自用)
本文是作者关于Spark SQL的学习笔记,详细记录了Spark SQL的基本概念、数据源操作、DataFrame/Dataset API使用,以及如何进行复杂查询和性能调优。通过实例展示了如何在大数据处理中有效地运用Spark SQL。
摘要由CSDN通过智能技术生成