flume mysql hive_用 hadoop + flume + sqoop + mysql + hive 搭建的项目 ??? 记录一下流程...

我之前hadoop的环境都配好了

今天主要配置其他几种

第一步是flume的环境,这个直接解压压缩包,编辑一个conf文件

主要的功能,是监听一个目录,当此目录有数据或者文件发生变化时候,就记录

然后通过sink发送到另外一台虚拟机的hdfs

这样我另外一台虚拟机的hdfs上面就有数据了

第二步是hive的环境,这个也是直接解压,进入bin目录就能启动

当我在另外一个地方启动的时候,hive库原先的数据就消失了

此时我们需要引用mysql

第三步配置mysql,先要查看你的虚拟机上面有没有安装过mysql服务,有的话全部干掉

最难的是配置mysql,一定要细心

我老是报错,原因就是没给权限分配

c52af8faf70eb0ca0bf213aa45e2905a.png

给完权限之后,立马在mysql创建hive数据库

5bb145f7e8c93270a29124aac22c2411.png

我们和可以用navicat来连接我们虚拟机上的mysql

最后就是sqoop了

我在一台虚拟主机上的,建立总表(一般都是外部表和分区表)

接着创建清洗表,从总表中找数据,插入清洗表(一般是内部表)

根据业务逻辑创建 业务逻辑表(一般是内部表),从清洗表中根据业务的计算规则,将数据计算后插入业务逻辑表

根据业务维度的特点,创建业务逻辑表。从业务逻辑表中插入数据到具体的业务维度表

为了满足可视化要求,还需要通过sqoop将hdfs的文件导出到mysql的指定表中

858cfc04583e9a9d41f30b6b0b748564.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值