spark写mysql配置jar_spark数据保存到mysql 通过Azkaban提交集群任务

本文介绍了如何使用Azkaban提交Spark任务,将数据从HDFS读取,处理后保存到MySQL数据库。通过编写bash脚本`sparkToMysql.sh`配置Spark参数和JDBC连接,利用`AccessLogSpark`类处理数据并执行SQL查询,最后以追加模式将结果写入MySQL的`iptop`表。
摘要由CSDN通过智能技术生成

spark数据保存到mysql 通过Azkaban提交集群任务

toMysql.job

#toMysql.job

type = command

command = bash sparkToMysql.sh

sparkToMysql.sh

#!/bin/bash

spark-submit \

--class AccessLogToMySql.AccessLogSpark \

# 集群地址 不写默认local

--master spark://master:7077 \

# 执行器数量 不写默认

--num-executors 10 \

# 执行器内存大小 不写默认

--executor-memory 3g \

# 执行器核数 不写默认

--executor-cores 8 \

# mysql jar包地址

--driver-class-path /root/hd/apache-hive-2.3.4-bin/lib/mysql-connector-java-8.0.14.jar \

# 上传任务jar到位置

/root/job/toMysql.jar

toMysql.job 和 sparkToMysql.sh压缩上传Azkaban定时执行

AccessLogSpark

// 获取sparksession

val spark = SparkSession.builder().appName("AccessLogSpark").getOrCreate()

// 引入隐式转换

import spark.sqlContext.implicits._

// 读取数据

val data = spark.sparkContext.textFile("hdfs://master/data/clickLog/20190211/xxxx_click_log_access.12019_02_11_16_49_24")

// 分割数据

val splitData = data.map(_.split(" "))

// 判断处理

val filtData = splitData.filter(x => x.length >= 11)

// 数据转化dataFrame

val logF = filtData.map(x => {LogTable(x(0), x(3), x(9).toLong)}).toDF()

// 创建视图

logF.createOrReplaceTempView("AccessTable")

// sql

val sql = "select ip, sum(upflow) as upSum from AccessTable group by ip order by upSum desc"

// 查询结果

val sumFlowDF = spark.sqlContext.sql(sql)

// 把结果保存在mysql表中

// 创建Properties对象,配置连接mysql的用户名和密码

val prop = new Properties()

prop.setProperty("user","hive")

prop.setProperty("password","hive")

// 写入数据库 追加模式 jdbc 表名 Properties

sumFlowDF.write.mode(SaveMode.Append).jdbc("jdbc:mysql://url:3306/sqoop_data", "iptop", prop)

// 停止

spark.stop()

生成jar toMysql.jar存放到服务器指定地址

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值