mongo数据定时导入mysql_一个实现数据批量从mongodb导入Mysql的方案

最新推荐文章于 2024-07-30 14:29:27 发布

weixin_39680609

最新推荐文章于 2024-07-30 14:29:27 发布

阅读量176

点赞数

文章标签： mongo数据定时导入mysql

本文链接：https://blog.csdn.net/weixin_39680609/article/details/113903412

版权

该博客介绍了一个批量将MongoDB数据定时导入到MySQL的解决方案，包括使用Shell脚本`weixin_data.sh`进行数据导出和加载，通过`mongoexport`筛选特定数据，然后使用`LOAD DATA LOCAL INFILE`将CSV数据导入MySQL。文中还展示了日期参数文件的结构，Mysql的表结构以及基于token计算uv的例子。

摘要由CSDN通过智能技术生成

1、脚本目录路径

[spark@Master data_dir]$ pwd

/home/spark/opt/data_dir

[spark@Master data_dir]$ ls -R /home/spark/opt/data_dir

/home/spark/opt/data_dir:

weixin_data.sh yemao_log_20151214.csv yemao_log_20151215.csv yesterday.list

2、Shell批处理脚本内容

[spark@Master data_dir]$ cat weixin_data.sh

#/bin/bash

#echo -n "please enter a day for runing :"

#read yesterday

while read yesterday

cd /home/spark/opt/data_dir/

/home/spark/opt/mongodb-2.7.0/bin/mongoexport -d yemao -c yemao_log_$yesterday --csv --query '{"browser":/MicroMessenger/}' -f id,time,url_from,url_current,url_to,token -o /home/spark/opt/data_dir/yemao_log_$yesterday.csv

/usr/local/mysql/bin/mysql -udatahouse -pDTHS2016 -h120.55.189.188 -P3306 --default-character-set=utf8 -e "use logdata; LOAD DATA LOCAL INFILE '/home/spark/opt/data_dir/yemao_log_$yesterday.csv' INTO TABLE yemao_weixin_log FIELDS TERMINATED BY ',' IGNORE 1 LINES;";

done < /home/spark/opt/data_dir/yesterday.list

3、存放日期的参数文件

[spark@Master data_dir]$ cat yesterday.list

20151214

20151215

4、Mysql端对应的表结构

show create table yemao_weixin_log;

CREATE TABLE `yemao_weixin_log` (

`id` int(20) DEFAULT NULL,

`time` varchar(200) DEFAULT NULL,

`url_from` varchar(200) DEFAULT NULL,

`url_current` varchar(200) DEFAULT NULL,

`url_to` varchar(200) DEFAULT NULL,

`token` varchar(200) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8

5、根据token的不同计算uv

select a1.log_date 统计日期,count(*) uv,sum(a1.pv) pv from

(select FROM_UNIXTIME(time,'%Y%m%d') log_date,token,count(*) pv from yemao_weixin_log group by FROM_UNIXTIME(time,'%Y%m%d'),token) a1

group by a1.log_date

6、说明

mysql load data数据导入时过滤首行使用IGNORE 1 LINES选项；

存放日期的参数文件每个日期一行，可根据需要写入；

mongodb中Like过滤使用如：--query '{"browser":/MicroMessenger/}'所示选项；因为方便起见，本文中的程序路径都写入了绝对路径，可确保调用的时候不出错。

weixin_39680609

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫