【阿里云中的大数据组件】技术选型和数仓系统流程设计 --- 阿里云的组件简介


一、DataHub

通俗来说这个 DataHub 类似于传统大数据解决方案中 Kafka 的角色,提供了一个数据队列功能
对于离线计算,DataHub提供了一个缓冲的队列作用。 同时由于 DataHub 提供了各种与其他阿里云上下游产品的对接功能,所以DataHub又扮演了一个数据的分发枢纽工作。

在这里插入图片描述

二、DataWorks 和 MaxCompute

MaxCompute(大数据计算服务)是阿里巴巴自主研发的海量数据处理平台,主要提供数据上传和下载通道,提供 SQL 及 MapReduce等多种计算分析服务,同时还提供完善的安全解决方案。
MaxCompute 可以简单的认为是 MapReduce 以及Yarn。
DataWorks(数据工厂,原大数据开发套件)是基于 MaxCompute计算引擎的一站式大数据工厂,它能帮助您快速完成数据集成、开发、治理、服务、质量、安全等全套数据研发工作。
DataWorks 可以认为是一个拥有图形化界面的Hive。

[图片]

三、RDS

阿里云关系型数据库Relational Database Service,简称 RDS,是一种稳定可靠、可弹性伸缩的在线数据库服务。
流程:
RDS服务器购买 —> RDS配置 —> 配置RDS白名单详情 —> 申请RDS外网地址 —> 连接mysql

四、技术选型和对比

1、阿里云技术跟之前的技术对比

在这里插入图片描述

2、技术选型

在这里插入图片描述

五、系统流程设计

[图片]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值