hadoop离线数据处理架构

最新推荐文章于 2024-01-18 02:12:01 发布

bandi4506

最新推荐文章于 2024-01-18 02:12:01 发布

阅读量477

点赞数

文章标签：大数据 javascript ViewUI

原文链接：http://www.cnblogs.com/arthurLance/p/10629316.html

版权

数据处理流程
1）数据采集
Flume： web日志写入到HDFS

2）数据清洗
脏数据
Spark、Hive、MapReduce 或者是其他的一些分布式计算框架
清洗完之后的数据可以存放在HDFS(Hive/Spark SQL)

3）数据处理
按照我们的需要进行相应业务的统计和分析
Spark、Hive、MapReduce 或者是其他的一些分布式计算框架

4）处理结果入库
结果可以存放到RDBMS、NoSQL

5）数据的可视化
通过图形化展示的方式展现出来：饼图、柱状图、地图、折线图
ECharts、HUE、Zeppelin

转载于:https://www.cnblogs.com/arthurLance/p/10629316.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
hadoop离线数据处理架构

数据处理流程1）数据采集 Flume： web日志写入到HDFS2）数据清洗脏数据 Spark、Hive、MapReduce 或者是其他的一些分布式计算框架清洗完之后的数据可以存放在HDFS(Hive/Spark SQL)3）数据处理按照我们的需要进行相应业务的统计和分析 Spark、Hive、MapReduce 或者是其他的一些分布式计算框架4）处理结果入库结果...
复制链接

扫一扫

bandi4506 CSDN认证博客专家 CSDN认证企业博客

码龄8年

0: 原创

-: 周排名

167万+: 总排名

3850: 访问

: 等级

8: 积分

0: 粉丝

0: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。