RDD转DF的两种方式

本文介绍了将RDD转换为DataFrame的两种方法。第一种方法是通过定义case class,使用map转换数据,再调用toDF。第二种方法适用于无法定义case class的情况,包括创建row类型的RDD、定义Schema和使用createDataFrame。
摘要由CSDN通过智能技术生成

1.第一种方式:

首先我们展示一下数据文件:

Michael, 29
Andy, 30
Justin, 19

然后我们开始编写第一种实现方法:
先写一个case calss,然后再map方式将数据转换成people形式通过toDF直接转换

def run1(sparkSession: SparkSession): Unit = {
   
		//隐式转换
	import sparkSession.implicits._
		//接收文件,是rdd类型
      val rdd: RDD[String] = sparkSession.sparkContext.textFile("data/people.txt")
      //根据逗号进行分割,将字段赋值给people
      val df: DataFrame = rdd.map(_.split(","))
      .map
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值