Spark---DataFrame学习(二)——select、selectExpr函数

select:处理列或表达式
selectExor:处理字符串表达式
在这里插入图片描述
数据集格式如下:
有三个字段,目的国家、出发国家、count
在这里插入图片描述

一.select

从df中选择列的方式,
1.DataFrame.select(“列名”),参数是列名的字符串格式。想要选出多列,可以用相同方式添加更多列名
在这里插入图片描述
在这里插入图片描述
小技巧:传入"*"选择所有列。
在这里插入图片描述

2.通过函数选择列
这些函数有DataFrame.col(“列名”)、col(“列名”)、column(“列名”)、expr(“列名”);以及两种scala特有的语言支持,$“列名”、‘列名
在这里插入图片描述
在这里插入图片描述
函数方式也能一次选择多列
在这里插入图片描述
3.函数方式和列名字符串方式不能同时使用
在这里插入图片描述
4.简单数据操作,聚合函数的使用
数据操作
在这里插入图片描述
聚合函数使用
在这里插入图片描述

二、selectExpr

selectExpr可以构建复杂的表达式,和select里面使用expr函数有一样的效果。
1.选择列,和select一样可以通过列名选组
在这里插入图片描述
2.DataFrame.selectExpr(“表达式”)
下图中使用as对一列进行了重命名
在这里插入图片描述
3.判断的字符串表达式,withinCountry这列是判断起点终点是否一致
在这里插入图片描述
4.聚合操作
这里第一列计算了count的均值,第二列的第一步先计算出不同目的地,第二部计算不同目的地的数量。
在这里插入图片描述

总结:

select和selectExpr函数的功能十分接近,可以说基本上一致。唯一的区别可能就是个人的使用习惯,这一点从官方文档里面也能看出。

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值