Spark RDD转换为DataFrame

#构造case class,利用反射机制隐式转换

scala> import spark.implicits._

scala> val rdd= sc.textFile("input/textdata.txt")

scala> case class Person(id:Int,name:String)

scala> val df = rdd.map(_.split(",")).map(x=>Person(x(0).toInt,x(1))).toDF

scala> df.show

+---+--------+

id| name|

+---+--------+

| 1|zhangsan|

| 2| lisi|

| 3| wangwu|

| 4| zhaoliu|

+---+--------+

 

#通过schema,Row构造dataframe

scala> import org.apache.spark.sql.types._

scala> import org.apache.spark.sql.Row

scala> val structFields = Array(StructField("id",IntegerType,true),StructField("name",StringType,true))

scala> val structType = StructType(structFields) #创建schema结构

scala> val lines= sc.textFile("input/textdata.txt")

scala> val rdd = lines.map(_.split(",")).map(x=>Row(x(0).toInt,x(1))) #创建RDD[Row]

scala> val df = spark.createDataFrame(rdd,structType) #通过RDD[Row],schema构建DataFrame

scala> df.show

+---+--------+

id| name|

+---+--------+

| 1|zhangsan|

| 2| lisi|

| 3| wangwu|

| 4| zhaoliu|

+---+--------+

文本:

 

cat textdata.txt

1,zhangsan

2,lisi

3,wangwu

4,zhaoliu

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值