Spark 创建DataFrame的三种方式

26 篇文章 0 订阅

1.从数据库读数据创建DF

  /**SQLComtext 创建 DataFrame 1**/
  def createDataFrame(sqlCtx: SQLContext): Unit = {
    val prop = new Properties()
    prop.put("user","root")
    prop.put("password","abc314")
    prop.put("driver","com.mysql.jdbc.Driver")
    val dataDF = sqlCtx.read.jdbc("jdbc:mysql://localhost:3306/test","sy_users",prop)
    dataDF.show()

2. 通过SQLContext的createDataFrame方法构建DF

/**SQLComtext 创建 DataFrame 2**/
  def createDtaFrame(sparkCtx:SparkContext,sqlCtx:SQLContext):Unit = {
    val rowRDD = sparkCtx.textFile("D://TxtData/studentInfo.txt").map(_.split(",")).map(p => Row(p(0),p(1).toInt,p(2)))
    val schema = StructType(
      Seq(
        StructField("name",StringType,true),
        StructField("age",IntegerType,true),
        StructField("studentNo",StringType,true)
      )
    )
    val dataDF = sqlCtx.createDataFrame(rowRDD,schema)

    //df注册到内存表
    dataDF.registerTempTable("Student")
    val result = sqlCtx.sql("select * from Student")
    result.show()

    //    dataDF.select("name").show()
    //    dataDF.filter(dataDF("age") <14).show()
    //    dataDF.where("age <> ''").show()
  }

3.通过隐式转换构建DF

 /** SQLComtext 创建 DataFrame 3 **/
  case class Person(str: String, i: Int, str1: String)
  def createDF(sparkCtx:SparkContext,sqlCtx:SQLContext):Unit = {
    import sqlCtx.implicits._
    val dataDF = sparkCtx.textFile("D://TxtData/studentInfo.txt")
      .map(_.split(",")).map(p => Person(p(0),p(1).toInt,p(2))).toDF()
    dataDF.show()
  }

推荐第三种方式,简洁明了!

4.DF入Hive库实例

 result.where("userID <> '-' and newsID <> ''").registerTempTable("temp_newsTable")
    hiveCtx.sql("INSERT OVERWRITE TABLE mmbigdata.ods_mm_news " +
      "partition (year='"+year+"',month='"+month+"',day='"+day+"',type='view') select * from temp_newsTable")

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值