Scala中运用windowing函数

最新推荐文章于 2021-12-13 22:17:25 发布

kopunk

最新推荐文章于 2021-12-13 22:17:25 发布

阅读量461

点赞数

分类专栏：大数据学习 spark scala 文章标签： scala

本文链接：https://blog.csdn.net/kopunk/article/details/96773692

版权

先创建一个rank spec

// 用df("salary").asc代表升序排列，desc代表降序
val rankSpec = Window.partitionBy("age").orderBy(df("salary").desc)

然后为自己的表添加一列rank

val sararyRank = df.withColumn("rank",dense_rank().over(rankSpec))

完整代码：

/*
*  利用spark读取txt文件的内容，生成rdd
*  并用case class的定义去将rdd转化为dataFrame
*
*
*  如果读入一个没有文件头，要另外给schema
* */

import org.apache.spark.{SparkConf, SparkContext}
import org.apache.log4j._
import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.expressions.Window
import org.apache.spark.sql.functions._

case class people(id:Int, name:String, age:Int)
case class salary (name:String, salary:Int)
case class peopleSalary(id:Int, name:String, age:Option[Int], salary:Int)

object MyScalar {
  def main(args: Array[String]): Unit = {
    Logger.getLogge

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kopunk

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Scala中运用windowing函数

先创建一个rank spec// 用df("salary").asc代表升序排列，desc代表降序val rankSpec = Window.partitionBy("age").orderBy(df("salary").desc)然后为自己的表添加一列rankval sararyRank = df.withColumn("rank",dense_rank().over(ra...
复制链接

扫一扫