Spark SQL的使用

最新推荐文章于 2024-05-10 20:03:52 发布

hddyxl

最新推荐文章于 2024-05-10 20:03:52 发布

阅读量515

点赞数 3

分类专栏： SparkSQL 文章标签： spark ide sparkSQL

本文链接：https://blog.csdn.net/hddyxl/article/details/50851080

版权

SparkSQL 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Spark SQL的使用
本文主要给出了Spark1.4之前和之后IDE编译的区别

Spark1.4之前

在1.4版本之前table的注册使用的是registerAsTable方法

case class Person(name:String,age:Int)
def main(args: Array[String]): Unit = {
  val sconf = new SparkConf().setMaster("local[5]").setAppName("SQL")
  val sc = new SparkContext(sconf)
  val sqlContext = new org.apache.spark.sql.SQLContext(sc)
  //将rdd隐式转换为schemeRDD
  import sqlContext._
  val people = sc.textFile("D:\\123.txt").map(_.split(","))
              .map(p => Person(p(0),p(1).trim().toInt)).toDF()
  people.registerASTable("people")
  val res = sqlContext.sql("select name,age from peop")
  res.map { t => t(0)+" "+t(1) } collect() foreach { println }
}

Spark1.4及以后

使用registerTempTable取代registerAsTable并且方法所在的包也由sqlContext._ 变为qlContext.implicits._

case class Person(name:String,age:Int)
def main(args: Array[String]): Unit = {
  val sconf = new SparkConf().setMaster("local[5]").setAppName("SQL")
  val sc = new SparkContext(sconf)
  val sqlContext = new org.apache.spark.sql.SQLContext(sc)
  //将rdd隐式转换为schemeRDD
  import sqlContext.implicits._
  val people = sc.textFile("D:\\123.txt").map(_.split(","))
              .map(p => Person(p(0),p(1).trim().toInt)).toDF()
  people.registerTempTable("people")
  val res = sqlContext.sql("select name,age from peop")
  res.map { t => t(0)+" "+t(1) } collect() foreach { println }
}