创建一个dataframe:
df = spark.createDataFrame([("a", 1), ("b", 2), ("c", 3)], ["Col1","a"])
df.select(df.colRegex("`(Col)?.+`")).show() #返回字段名中以Col开头的列
,也可以理解为过滤掉Col(返回除Col以外) 列。
df.select(df.colRegex("`(Col1)?.+`")).show() #过滤掉Col1列
创建一个dataframe:
df = spark.createDataFrame([("a", 1), ("b", 2), ("c", 3)], ["Col1","a"])
df.select(df.colRegex("`(Col)?.+`")).show() #返回字段名中以Col开头的列
,也可以理解为过滤掉Col(返回除Col以外) 列。
df.select(df.colRegex("`(Col1)?.+`")).show() #过滤掉Col1列