SparkSql 常见使用

最新推荐文章于 2024-06-18 08:45:00 发布

政zz

最新推荐文章于 2024-06-18 08:45:00 发布

阅读量191

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/qq_36698213/article/details/101016453

版权

3 篇文章 0 订阅

订阅专栏

读文件:val peopleDf = spark.read.textFile("E:\\07-hadoop\\01-spark\\sql\\people.txt")

df转rdd : val peopleDs = peopleDf.rdd
将rdd变换为一行一行:
val peopleRdd = peopleDs.map(line => Row(line.split(",")(0), line.split(",")(1).toInt))
通过rdd和schema 创建临时表 spark.createDataFrame(peopleRdd,schema).createOrReplaceTempView("people")
使用sql查询临时表:val peopleSqlDf = spark.sql("select * from people")
两个dateFrame之间join等操作:

val rdd =

locationSqlDf.join(peopleSqlDf,locationSqlDf("name") === peopleSqlDf("name")).drop(locationSqlDf("name")).toDF()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注