SparkSql编程之《DataFrame转换操作》

一、数据准备,json文件

项目处新建people.json文件

创建DataFrame

val df = spark.read.json("input/people.json")

二、DataFrame上的转化操作

1、where操作

df.where("name='Andy'").show()

|age|name|
+---+----+
| 30|Andy|

2、查询操作

(1)select 获取指定字段值

df.select("name","age").show()

|   name| age|
+-------+----+
|Michael|null|
|   Andy|  30|
| Justin|  19|

df.select(df("age")+1).show()

|(age + 1)|
+---------+
|     null|
|       31|
|       20|

(2)selectExpr  对指定字段进行特殊处理。可以使用函数

df.selectExpr("name as myname","age","round(age)","concat(name,age)").show()

+-------+----+-------------+---------------------------------+
| myname| age|round(age, 0)|concat(name, CAST(age AS STRING))|
+-------+----+-------------+---------------------------------+
|Michael|null|         null|                             null|
|   Andy|  30|           30|                           Andy30|
| Justin|  19|           19|                         Justin19|
+-------+----+-------------+---------------------------------+

(3)col: 获取指定字段

<
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值