kettle同步数据到hive 巨慢_一不小心做了个大数据中台(1)

本文讨论了教育行业ToB业务中,使用Kettle同步MySQL数据到Hive遇到的性能问题。随着业务量增长,原有离线计算和数据处理方式无法应对,导致系统负载高、数据准确性问题。解决方案包括引入消息队列、预处理引擎和优化数据结构,提高查询效率和数据一致性。
摘要由CSDN通过智能技术生成
0 1业务背景

即将火爆到起飞的教育行业,还是ToB的

曾经有一份工作,我有幸接触到,做的是教育行业,而且是ToB的。

大数据、教育、ToB,三个风口啊,别说猪了,铅球都能飞起来了。

不过,这次不是聊八卦了,而是要说技术内容了。

所谓的教育ToB,说成是多媒体教学系统就很好理解了。

客户主要是学校或教育单位,用户以老师和学生为主。

将老师的课堂讲解、布置作业、学生答题、成绩统计等全部在线上,并提供一些数据分析、电子阅卷等辅助功能;

同时,还有一个相对薄弱的学生家长端,主要是可以查看学生成绩、学习情况、购买一些练习等。

额外说一句,现在教育成本还真是越来越来高了,老师经常发给学生一个pdf,就是作业了,让学生自己想办法打印,做完再交回去,我看到很多打印店都推出了会员业务。

0 2技术背景

教师端

教师端是一个独立的业务系统,是很标准的一个web项目,前后端分离,数据库是mysql。

最关键的3个业务场景是教师出卷(一份作业或一份试卷,统一被认为是一份试卷),学生作答,教师阅卷。

数据中心

使用sqoop工具,每天0点开始,将前一天的数据从mysql同步到hdfs,结合Hive做数据处理。调度工具是kettle,对,你没看错,就是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值