spark小记——scala的Map类型转sparksql的dataframe

最新推荐文章于 2022-04-12 22:17:13 发布

X5-j

最新推荐文章于 2022-04-12 22:17:13 发布

阅读量2.8k

点赞数

分类专栏： SPARK

本文链接：https://blog.csdn.net/u011535508/article/details/100537521

版权

SPARK 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

源码：

package com.ydj.sql

import org.apache.spark.sql.SparkSession

import scala.collection.mutable.ArrayBuffer

/**
  * @Auther: yuandejin
  * @Date: 2019-09-04 13:43
  * @Description: 
  */
object MapToDataFrame {


  def main(args: Array[String]): Unit = {

    //1. 构建sparkSession
    val sparkSession = SparkSession
      .builder()
      .appName("MapToDataFrame")
      .master("local")
      .getOrCreate()

    //2. 隐式转换 rdd转dataFrame
    import sparkSession.implicits._
    
    //3. scala的Map数据结构
    val map = Map("aa" -> "aaa", "bb" -> "bbb")

    //4. map的所有key
    val mk = map.keys
    
    //5. 创建rdd
    val rdd = sparkSession.sparkContext.parallelize(Seq(map))
    
    //6. 根据map的key取出所有的值，构建新的rdd，并转成dataFrame 
    val frame = rdd.map(x => {
        val bb = new ArrayBuffer[String]()
        for (k: String <- mk) {
          bb.+=(x(k))
        }
        bb
      }).map(x => (x(0), x(1))).toDF("k1", "k2")
    //7. 打印
    frame.show()
  }
}

运行结果：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

X5-j

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
spark小记——scala的Map类型转sparksql的dataframe

源码：package com.ydj.sqlimport org.apache.spark.sql.SparkSessionimport scala.collection.mutable.ArrayBuffer/** * @Auther: yuandejin * @Date: 2019-09-04 13:43 * @Description: */object ...
复制链接

扫一扫