java dataframe agg_DataFrame 的函数

本文详细介绍了Java DataFrame的各种操作,包括数据收集、计数、描述统计、选择特定行以及聚合操作如agg,如max、avg等。还涉及到数据过滤、排序、去重、关联和转换等操作,对于DataFrame的日常处理提供了全面的参考。
摘要由CSDN通过智能技术生成

Action 操作

collect() ,返回值是一个数组,返回dataframe集合所有的行

collectAsList() 返回值是一个java类型的数组,返回dataframe集合所有的行

count() 返回一个number类型的,返回dataframe集合的行数

describe(cols: String*) 返回一个通过数学计算的类表值(count, mean, stddev, min, and max),这个可以传多个参数,中间用逗号分隔,如果有字段为空,那么不参与运算,只这对数值类型的字段。例如df.describe(“age”, “height”).show()

first() 返回第一行 ,类型是row类型

head() 返回第一行 ,类型是row类型

head(n:Int)返回n行 ,类型是row 类型

show()返回dataframe集合的值 默认是20行,返回类型是unit

show(n:Int)返回n行,,返回值类型是unit

table(n:Int) 返回n行 ,类型是row 类型

dataframe的基本操作

cache()同步数据的内存

columns 返回一个string类型的数组,返回值是所有列的名字

dtypes返回一个string类型的二维数组,返回值是所有列的名字以及类型

explan()打印执行计划 物理的

explain(n:Boolean) 输入值为 false 或者true ,返回值是unit 默认是false ,如果输入true 将会打印 逻辑的和物理的

isLocal 返回值是B

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值