DataFrame 创建视图进行两个表之间关联

最新推荐文章于 2023-07-31 16:53:10 发布

JasonAndChen

最新推荐文章于 2023-07-31 16:53:10 发布

阅读量941

点赞数

分类专栏： Spark 文章标签： Spark

本文链接：https://blog.csdn.net/asdrt12589wto1/article/details/102219823

版权

Spark 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

scala> df1.show
+-----+------+---------+----+----------+----+----+------+
|empno| ename| job| mgr| hiredate| sal|comm|deptno|
+-----+------+---------+----+----------+----+----+------+
| 7369| SMITH| CLERK|7902|1980/12/17| 800| 0| 20|
| 7499| ALLEN| SALESMAN|7698| 1981/2/20|1600| 300| 30|
| 7521| WARD| SALESMAN|7698| 1981/2/22|1250| 500| 30|
| 7566| JONES| MANAGER|7839| 1981/4/2|2975| 0| 20|
| 7654|MARTIN| SALESMAN|7698| 1981/9/28|1250|1400| 30|
| 7698| BLAKE| MANAGER|7839| 1981/5/1|2850| 0| 30|
| 7782| CLARK| MANAGER|7839| 1981/6/9|2450| 0| 10|
| 7788| SCOTT| ANALYST|7566| 1987/4/19|3000| 0| 20|
| 7839| KING|PRESIDENT|7839|1981/11/17|5000| 0| 10|
| 7844|TURNER| SALESMAN|7698| 1981/9/8|1500| 0| 30|
| 7876| ADAMS| CLERK|7788| 1987/5/23|1100| 0| 20|
| 7900| JAMES| CLERK|7698| 1981/12/3| 950| 0| 30|
| 7902| FORD| ANALYST|7566| 1981/12/3|3000| 0| 20|
| 7934|MILLER| CLERK|7782| 1982/1/23|1300| 0| 10|
+-----+------+---------+----+----------+----+----+------+

scala> case class Dept(deptno: Int, dname: String, loc: String)
defined class Dept

scala> val lines = sc.textFile("/opt/data/dept.csv").map(_.split(","))
lines: org.apache.spark.rdd.RDD[Array[String]] = MapPartitionsRDD[55] at map at <console>:24

scala> lines.collect
res21: Array[Array[String]] = Array(Array(10, ACCOUNTING, NEW YORK), Array(20, RESEARCH, DALLAS), Array(30, SALES, CHICAGO), Array(40, OPERATIONS, BOSTON))

scala> val allDept = lines.map(x =>
| Dept(x(0).toInt, x(1).toString, x(2).toString)
| )
allDept: org.apache.spark.rdd.RDD[Dept] = MapPartitionsRDD[56] at map at <console>:28

scala> val df2=allDept.toDF
df2: org.apache.spark.sql.DataFrame = [deptno: int, dname: string ... 1 more field]

scala> df2.createOrReplaceTempView("dept")

scala>

JasonAndChen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DataFrame 创建视图进行两个表之间关联

scala> df1.show+-----+------+---------+----+----------+----+----+------+|empno| ename| job| mgr| hiredate| sal|comm|deptno|+-----+------+---------+----+----------+----+----+------+| 7369|...
复制链接

扫一扫