Rdd没法调用toDF原因

最新推荐文章于 2021-11-04 23:21:50 发布

hellozhxy

最新推荐文章于 2021-11-04 23:21:50 发布

阅读量2.5k

点赞数

分类专栏： spark

spark 专栏收录该内容

127 篇文章 14 订阅

订阅专栏

创建rdd方法1//use case class Person
case class Person(name:String,age:Int)
def rddToDFCase(sparkSession : SparkSession):DataFrame = {
//导入隐饰操作，否则RDD无法调用toDF方法
import sparkSession.implicits._
val peopleRDD = sparkSession.sparkContext
.textFile("file:/E:/scala_workspace/z_spark_study/people.txt",2)
.map( x => x.split(",")).map( x => Person(x(0),x(1).trim().toInt)).toDF()
peopleRDD
}

创建rdd方法2：

def rddToDF(sparkSession : SparkSession):DataFrame = {
//设置schema结构
val schema = StructType(
Seq(
StructField("name",StringType,true)
,StructField("age",IntegerType,true)
)
)
val rowRDD = sparkSession.sparkContext
.textFile("file:/E:/scala_workspace/z_spark_study/people.txt",2)
.map( x => x.split(",")).map( x => Row(x(0),x(1).trim().toInt))
sparkSession.createDataFrame(rowRDD,schema)
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hellozhxy

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Rdd没法调用toDF原因

创建rdd方法1//use case class Person case class Person(name:String,age:Int) def rddToDFCase(sparkSession : SparkSession):DataFrame = { //导入隐饰操作，否则RDD无法调用toDF方法 import sparkSession.implicits._ ...
复制链接

扫一扫