大概了解一下离线项目(未完成)

数仓概念

      数据仓库(Data Warehouse),是为企业所有决策制定过程,提供所有系统数据支持的战略集合
      通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本、提高产品质量等。

      数据仓库,并不是数据的最终目的地,而是为数据最终的目的地做好准备。这些准备包括对数据的:清洗,转义,分类,重组,合并,拆分,统计等等。 

项目需求分析

一、项目需求

1.用户行为数据采集平台搭建

2.业务数据采集平台搭建

3.数据仓库维度建模

4.分析,用户、流量、会员、商品、销售、地区、活动等电商核心主题,统计的报表指标近100个。完全对比中型公司

5.采用即席查询工具,随时进行指标分析

6.对集群性能进行监控,发生异常需要报警

7.元数据管理

8.质量监控

二、思考题

1、项目技术如何选型

2、框架版本如何选型(Apache、CDH、HDP)

3、服务器使用物理机还是云主机

4、如何确认集群规模?(假设每台服务器8T硬盘成本是否吼得住)

 技术选型

技术选型主要考虑因素:数据量大小、业务需求、行业内经验、技术成熟度、开发维护成本、总成本计算

数据采集传输Flume,Kadka,Sqoop,Logstash,DataX
数据传输MySql,HDFS,HBase,Redis,MongoDB
数据计算Hive,Tez,Spark,Flink,Storm
数据查询Presto,Druid,Impala,Kylin
数据可视化Echarts,Superset,QuickBI,DataV
任务调度Azkaban,Oozie
集群监控Zabbix
元数据管理Atlas
数据质量监控Criffin

系统数据流程设计

框架版本选择

服务器选型

???

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值