使用Sqoop1.4.7将Hadoop分区表同步到MySQL_实践带源码复制可用

程序干货王

已于 2023-04-03 21:20:35 修改

阅读量279

点赞数

分类专栏： sqoop 大数据文章标签： mysql hadoop 数据库 sqoop 大数据

于 2023-04-02 15:49:11 首次发布

本文链接：https://blog.csdn.net/manformer/article/details/129911773

版权

大数据同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

sqoop

2 篇文章 0 订阅

订阅专栏

本文提供了一个名为sqoop_ads_test_table_1d_to_MySQL.sh的shell脚本示例，用于将Hadoop的分区表数据通过Sqoop导出到MySQL。脚本中设置了环境变量以区分测试和生产环境，先清空目标表数据，然后执行数据导出。该过程适用于已预先在MySQL中创建的目标表。

摘要由CSDN通过智能技术生成

Sqoop导出Hadoop分区表数据到MySQL

前提: 目标表需要提前在MySQL数据库中创建。

将下列shell脚本命名为sqoop_ads_test_table_1d_to_MySQL.sh,直接复制即可，亲测可用.

echo "`date`--------将Hadoop分区数据同步到MySQL---------sqoop eval job start!!!!!"

# 将所需分区通过外部参数传入
dt=$1

hive_db_name=ads
hive_table_name=ads_test_table_1d
# MySQL结果表名
table_name=ads_test_table_1d
# 需要的字段
table_columns="id,name,phone"

# env test prod 通过设置env控制生产环境还是测试环境
env=prod
my_url="jdbc:mysql://192.168.10.xxx:3306/test"
username="root"
password=your_pwd

if [ $env = "prod" ] ;then
my_url="jdbc:mysql://192.168.10.xxx:3306/prod"
username="bigdata"
password=your_pwd
fi

# 由于是overwrite形式，需要先将目标表数据清除
echo "`date`----------sqoop eval job start!!!!!"
nohup sqoop eval \
--connect "${my_url}" \
--username ${username} --password   "${password}" \
--query "delete from $table_name "

echo "`date`----------sqoop export job start!!!!!"
nohup sqoop export --hcatalog-database ${hive_db_name} \
--hcatalog-table ${hive_table_name}  \
--hcatalog-partition-keys dt  \
--hcatalog-partition-values ${dt} \
--connect "${my_url}" \
--username ${username} --password   "${password}" \
--table $table_name  \
--columns $table_columns
echo "`date`----------sqoop export job end!!!!!"

然后在虚拟机运行

sh sqoop_ads_test_table_1d_to_MySQL.sh '2023-04-01'

后边的日期即将hadoop中分区为2022-04-01的数据同步到MySQL。

后边将会分享同步Hadoop非分区表数据同步到MySQL.

最后，感谢大家的观看，有需要改进的地方希望大家在下方留言，关注我，有不懂的技术问题为你解决。

程序干货王

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
使用Sqoop1.4.7将Hadoop分区表同步到MySQL_实践带源码复制可用

sqoop同步Hadoop分区表指定分区数据到MySQL源码级脚本，复制可用
复制链接

扫一扫

专栏目录