背景 在使用dataframe时,我们常常需要依据应用场景,需要将原来一条record 拆分为多行(字段数增加1个,record增加),或者在一个record中根据已有字段拆分为多列(仍是1个record,字段数增加) 拆分为多个字段(多列) from pyspark.sql import functions # 假设需要将字段col_1的内容按照‘@’字符拆分为两个字段 # col_new_1, col_new2 # your_df 为已加载dataframe split_col = functions.split(your_df['col_1'], '@'