使用spark将MySQL数据导入hive

import org.apache.spark.sql.{DataFrame, SaveMode, SparkSession}

object spark_from_mysql_to_hive {
def main(args: Array[String]): Unit = {
val spark: SparkSession = SparkSession.builder().master(“local[*]”).enableHiveSupport()
.config(“spark.debug.maxToStringFields”, “100”)
.config(“spark.sql.debug.maxToStringFields”, “100”)
.config(“hive.metastore.uris”, “thrift://ip:9083”)
//由于 Hive 和 SparkSQL 在 Decimal 类型上使用了不同的转换方式写入 Parquet,
// 导致 Hive 无法正确读取 SparkSQL 所导入的数据。对于已有的使用 SparkSQL 导入的数据,
// 如果有被 Hive/Impala 使用的需求,建议加上 spark.sql.parquet.writeLegacyFormat=true,重新导入数据。
.config(“spark.sql.parquet.writeLegacyFormat”, true)
.appName(“mysql_to_hive”).getOrCreate();
import spark.implicits._
/**
* 使用临时表,建hive表,用insert into语句插入
* 直接用saveAsTable生成hive表,之前要执行spark.table
*/
val jdbcDF: DataFrame = spark.read.format(“jdbc”)
.option(“url”,“jdbc:mysql://ip:3306/finance? characterEncoding=utf-8&serverTimezone=UTC&useSSL=false”)
.option(“driver”,“com.mysql.jdbc.Driver”)
.option(“dbtable”,“base_store”)
.option(“user”,“root”)
.option(“password”,“d0sD6Ffs7sGkHDF8mPnHJ2cl”)
.load();
// spark.sql(“create table finance.base_store( id int, student String) ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t’;”);
jdbcDF.show();
jdbcDF.createOrReplaceTempView(“temp”);
println("+"*500);
spark.sql(“select id,store_brand from temp”).show();
spark.sql(“use finance”);
// spark.sql(“set hive.stats.autogather=false”);
spark.sql(“drop table if exists base_store”);
spark.sql(“CREATE TABLE if not exists finance.base_store(id int,store_brand String)ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘,’”);
println(“开始导入”);
// spark.sql(“insert into finance.base_store select id,store_brand from temp”);
// 在saveAsTable之前要执行spark.table
val df = spark.table(“temp”);
// spark.conf.set(“spark.sql.parquet.writeLegacyFormat”, true);
df.write.mode(SaveMode.Overwrite).saveAsTable(“hive_records”);
spark.sql(“select * from hive_records”).show();
// jdbcDF.write.format(“hive”).saveAsTable(“base_store”);
// jdbcDF.write.mode(SaveMode.Overwrite).saveAsTable(“base_store”);
// jdbcDF.write.mode(“Overwrite”).saveAsTable(“base_store”);

println("导入完成");
spark.stop();

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值