python spark dataframe删除字段_Spark中对DataFrame的基础操作:列增加,列删除,行增加,列名更换,排序等等...

可以使用select和selectExpr来操作DataFrame中的列

例如查询:DEST_COUNTRY,ORIGIN_COUNTRY

val path="/Volumes/Data/BigData_code/data/flight-data/json/2015-summary.json"

val dataDF = spark.read.format("json").load(path)

val dataSelect = dataDF.select("DEST_COUNTRY_NAME", "ORIGIN_COUNTRY_NAME")

dataSelect.show(2)

新增一列

判断目的国家和起飞国家是否是同一个。

//创建一个新的列,用来表示目的国家和源国家是否是同一国家

dataDF.selectExpr(

"*", "(DEST_COUNTRY_NAME = ORIGIN_COUNTRY_NAME) as inCountry"

).show(30)

使用withColumn添加列

//添加1列

dataDF.withColumn("numberOne", lit(1)).show(10)

删除一列

//删除列

//方法1:

dataDF.selectExpr("DEST_COUNTRY_NAME", "count").show(2)

//方法2:

dataDF.drop("ORIGIN_COUNTRY_NAME").show(2)

连接和追加行(联合操作)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值