当列名是中文时,你引用该列的名字会报错。
df.姓名 #报error!!
df.name #没有error
所以需要使用 selectExpr改名
df = spark.read.csv("./ex.csv").selectExpr("姓名 as name")
df.name #不报错
ref:https://stackoverflow.com/questions/34077353/how-to-change-dataframe-column-names-in-pyspark