大数据实战项目(1)-项目简介、开发技术、工具、架构等

项目目标

  • 完成大数据项目的架构设计,安装部署,架构继承与开发,用户可视化交互设计
  • 完成实时在线数据分析
  • 完成离线数据分析

具体功能

  • 捕获用户浏览日志信息(TB)
  • 实时分析前N名流量最高的新闻话题
  • 实时统计当前线上已曝光的新闻话题
  • 统计哪个时段用户浏览量最高
  • 报表展示

工具、技术、语言

开发工具

  • VMware Workstation
  • CentOS 6.4
  • Xshell 6
  • FileZilla
  • IntelliJ IDEA 2018
  • Notepad++
  • maven-3.6.0

项目技术点

  • zookeeper-3.4.5-cdh5.10.0
  • hadoop-2.6.0
  • hbase-1.0.0-cdh5.4.0
  • spark-2.2.0
  • kafka_2.11-0.10.0.0
  • flume-1.7.0-bin
  • hive-2.1.0
  • hue-3.9.0-cdh5.15.0
  • mysql
  • J2EE
  • Websocket
  • Echarts

项目语言

  • jdk1.8.0_191
  • scala-2.11.12
  • shell

架构、数据流程、资源规划

数据流程

在这里插入图片描述

(图片来自于所学课程)

集群资源规划

bigdata-pro01.bigDAta.combigdata-pro02.bigDAta.combigdata-pro03.bigDAta.com
HDFSNameNode DataNodeNameNode DataNodeDataNode
YARNRescourceManager NodeManagerRescourceManager NodeManagerNodeManager
ZooKeeperZooKeeperZooKeeperZooKeeper
KafkaKafkaKafkaKafka
HBaseMaster RegionServerMaster RegionServerRegionServer
Flume日志合并预处理日志采集日志采集
MySQLMySQL
SparkSpark workerSpark master workerSpark worker
HiveHive
HueHue

大数据实战项目(2)-数据采集、处理、分发流程所涉及到的框架及配置
大数据实战项目(3)-离线处理及实时处理部分

  • 3
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值