数据中台架构

基础设施
HDP + 私有云 + k8s/docker
存储组件
Hadoop/hive/ELK/GP/Tidb/hbase/kudu
离线ETL
HQL/spark/presto/kettle
实时ETL
Kafka/cdc/flink/spark streaming
OLAP分析
Kylin/clickhouse/BI
数据仓库建模 kimball/inmon建模
基于sap / wms / crm; sap(mm/sd/fico)
流程Ods / dwd/dwm /dws/ops
Kimball: 大量事实表和维度表,包括事务事实表,周期快照表,累积快照事实
Inmon : 企业级数仓,兼顾公司所有业务,ER模型

上层应用
数据治理
功能: 元数据管理,主数据管理,数据质量,数据标准,数据安全
实现方案: atlas,数据治理平台
安全: Ranger/kerberos/SSL/TLS和用户权限管理
监控运维:prometheus+python脚本自动运维
数据分析
BI指标,对比分析,python数据分析,机器学习决策,深度学习预测

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《阿里数据中台架构》是一本介绍阿里巴巴集团数据中台架构的PDF文档。阿里巴巴集团是中国最大的电商企业,数据中台架构为其数据管理和分析提供了重要的支持。 数据中台架构是一种将数据资源整合、管理和利用的方式,通过构建统一的数据中台,实现数据的高效共享和价值挖掘。阿里巴巴的数据中台架构在整个集团范围内起到了核心作用。 在这份PDF中,阿里巴巴详细介绍了其数据中台的建设思路和实际应用。其架构主要包括数据存储与计算、数据治理、数据服务和数据应用四个方面。 数据存储与计算方面,阿里巴巴采用了大规模分布式存储和计算技术,保证了高可用性和弹性扩展能力。同时,利用了云原生和容器化技术,实现了高效的资源管理和部署。 数据治理方面,阿里巴巴建立了一套统一的数据治理平台,包括数据准入的规范、数据质量的监控和数据安全的保障,确保了数据的可信度和一致性。 数据服务方面,阿里巴巴提供了一系列的数据服务,包括数据集成、数据清洗和数据分析等。这些数据服务可以被各个业务部门所使用,快速满足其数据需求。 数据应用方面,阿里巴巴构建了一整套的数据应用平台,支持不同业务部门的数据探索、挖掘和应用。其中包括了数据可视化、机器学习和人工智能等技术,帮助业务部门更好地理解和利用数据。 通过这份PDF文档,读者可以了解阿里巴巴集团在数据中台建设方面的经验和实践。阿里巴巴的数据中台架构充分利用了先进的技术手段,提高了数据的管理和应用效率,为企业的发展提供了有力的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值