一、查
1.1 行元素操作
打印行数据
df.show()
df.show(20)
df.take(20)
打印数据概要
df.printSchema()
df.describe().show()
查行数、取别名、查null值
df.count()
df.select(df.age.alias('age_v'),'name')
from pyspark.sql.functions import isnull
df = df.filter(isnull("col_a"))
查询唯一值
df.select