一、删 1.1 删除列 df.drop('age').collect() df.drop(df.age).collect() 1.2 删除空值 df = df.na.drop() # 删除任何列包含na的行 df = df.dropna(subset=['col1', 'col2']) # 删掉col1或col2中任一一列包含na的行 1.3 填充NA df.fillna(-1) 1.4 去重 # 返回不包含重复行的dataframe df.distinct