大数据开发如何规避细节问题,换一个角度来解决常见的细节问题

5.开发细节

5.1工程结构讲解

本书共一个系统架构,二个产品模块(离线和实现),四个项目包:Stormanalyse,Loggenerator, ClickStreamETL,SparkClickStream接下来分别来介绍对应的项目模块:

5.1.1离线项目代码目录结构

离线大数据日志处理由两部分组成,第一部分是Hadoop MR组成的ClickStreamETL项目,第二个是有Spark内存计算组成的SparkClickStream项目。

ClickStreamETL

Hadoop版本的日志处理分析Eclipse项目图示

开发代码UML项目结构图

代码文件组成结构(由于类图过大,故请到本书提供源下载)

SparkClickStream

Spark版本的日志处理分析

开发代码UML项目结构图


代码文件组成结构

5.1.2实时计算代码目录结构

实时计算代码由两部分组成,第一部分是loggenerator,负责仿造实时数据,进行数据解析,stormanalyse,是storm框架中代码开发实例,负责对数据进行处理的代码。


Stormanalyse

Storm版本的实时数据处理

Stormanalyse项目结果图

StormanalyseUML类图

Loggenerator

实时计算项目数据源模拟

Loggenerator项目结构图

LoggeneratorUML类图(由于类图过大,故请到本书提供源下载)



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值