读取文件0丢失问题
pd.read_excel()读取文件,如果数字前面有0,无论原文件的这一列是文本类型还是数值型,前边的0都会丢失,只能在read_excel()中加上参数 dtype='object',才不会丢失
df = spark.createDataFrame(pd.read_excel(csv_path+'test.xlsx',dtype='object'))
df = spark.createDataFrame(pd.read_excel(csv_path+'test.xlsx'))