SparkSQL读取普通格式的RDD通过反射方式加载DatFrame

import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{DataFrame, SparkSession}


/**
 * 通过反射方式将普通格式的RDD转换成DataFrame
 * 注意: 反射的方式将自定义类型的RDD转换成DataFrame过程中,会自动将对象中的属性当做DataFrame 中的列名,将自定义对象中的属性的类型当做DataFrame
 * 列的schema信息。
 */
case class PersonInfo(id: Int, name: String, age: Int, score: Double)

object ReadRDDToDF1 {
  def main(args: Array[String]): Unit = {
    val session = SparkSession.builder().master("local").appName("test").getOrCreate()
    val sc = session.sparkContext
    sc.setLogLevel("Error")
    val personInfos: RDD[String] = sc.textFile("T:/code/spark_scala/data/spark/personInfo")
    val personRDD: RDD[PersonInfo] = personInfos.map(info => {
      val arr = info.split(",")
      val id = arr(0).toInt
      val name = arr(1)
      val age = arr(2).toInt
      val score = arr(3).toDouble
      PersonInfo(id, name, age, score)
    })
    import session.implicits._
    val frame: DataFrame = personRDD.toDF()
    frame.printSchema()
    frame.show()

  }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值