pyspark dataframe 字段类型转换 pandas和pyspark的dataframe互转

最新推荐文章于 2023-03-16 16:16:43 发布

VIP文章木给哇啦丶

最新推荐文章于 2023-03-16 16:16:43 发布

阅读量4.1k

点赞数 2

分类专栏： pyspark 文章标签： spark python

本文链接：https://blog.csdn.net/lquarius/article/details/105564412

版权

知识点：

1、使用pyspark读取csv：spark.read.format("csv").load('/user/data.csv',header=True, inferSchema="true")

2、dataframe补充空值：fillna()

3、dataframe字段表示方式："APP_HOBY_CASH_LOAN"或df.APP_HOBY_CASH_LOAN或data_df["APP_HOBY_CASH_LOAN"]

pyspark dataframe使用astype实现dataframe字段类型转换

# 两种读取csv文件的方式
data_df = spark.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load("/user/data.csv")
data_df = spark.read.format("csv").load('/user/data.csv',header=True, inferSchema="true")
# 补充空值方法
data_df = data_df.fillna(0)
# 打印表结构 第一种执行较快
print(df_from_java.columns)
data_df.printSchema()
print(df_fr

最低0.47元/天解锁文章

优惠劵

木给哇啦丶

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
pyspark dataframe 字段类型转换 pandas和pyspark的dataframe互转

知识点：1、使用pyspark读取csv：spark.read.format("csv").load('/user/data.csv',header=True, inferSchema="true")2、dataframe补充空值：fillna()3、dataframe字段表示方式："APP_HOBY_CASH_LOAN"或df.APP_HOBY_CASH_LOAN或data_df["...
复制链接

扫一扫