spark hive数据导出到mysql 以及和 mysql进行表连接查询

最新推荐文章于 2023-11-20 20:28:25 发布

fanghailiang2016

最新推荐文章于 2023-11-20 20:28:25 发布

阅读量802

点赞数

分类专栏：大数据相关文章标签： mysql hive spark

本文链接：https://blog.csdn.net/fanghailiang2016/article/details/107971215

版权

大数据相关专栏收录该内容

18 篇文章 0 订阅

订阅专栏

数据准备

data/department.txt

1	技术部
2	运营部
3	市场部
4	财务部

data/employee.txt

1	1	方海亮	30
2	1	何胜强	35
3	1	林洪敏	32
4	2	丁泽林	27
5	2	李元元	25
6	3	王小飞	28
7	4	刘亦亭	31

bin/spark-sql

create database if not exists hadoop14;
use hadoop14;
create table department (
id int, name string
)
row format delimited fields terminated by '\t';
;
create table employee (
id int, department int, name string, age int
)
row format delimited fields terminated by '\t';
;
load data local inpath 'data/department.txt' into table department;
load data local inpath 'data/employee.txt' into table employee;

mysql连接准备工作

    val properties = new Properties()
    properties.put("user","hive_test")
    properties.put("password", "123456")
    val connectUrl = "jdbc:mysql://mustafa-PC:3306/hive_test"
    val targetTable = "department"

hive保存到mysql

    spark
      .read
      .table("hadoop14.department")
      .write
      .mode(SaveMode.Overwrite)
      .jdbc(connectUrl, targetTable, properties)

hive和mysql表连接

    val df: DataFrame = spark.read.jdbc(connectUrl, targetTable, properties)
    df.createOrReplaceTempView("department")

    var resultDf = spark.sql("select e.name as employee_name, e.age as employee_age, d.name as department_name from hadoop14.employee e join department d on e.department = d.id")

保存操作结果

resultDf.cache()
resultDf.write.mode(SaveMode.Overwrite).saveAsTable("hadoop14.employee_result")
    resultDf.write.format("json").format("parquet").mode(SaveMode.Overwrite).save("/user/mustafa/employee_result2")

fanghailiang2016

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark hive数据导出到mysql 以及和 mysql进行表连接查询

数据准备data/department.txt1 技术部2 运营部3 市场部4 财务部data/employee.txt1 1 方海亮 302 1 何胜强 353 1 林洪敏 324 2 丁泽林 275 2 李元元 256 3 王小飞 287 4 刘亦亭 31bin/spark-sqlcreate database if not exists hadoop14;use hadoop14;create table department (id int, n
复制链接

扫一扫