一、DataHub
通俗来说这个 DataHub 类似于传统大数据解决方案中 Kafka 的角色,提供了一个数据队列功能
对于离线计算,DataHub提供了一个缓冲的队列作用。 同时由于 DataHub 提供了各种与其他阿里云上下游产品的对接功能,所以DataHub又扮演了一个数据的分发枢纽工作。
二、DataWorks 和 MaxCompute
MaxCompute(大数据计算服务)是阿里巴巴自主研发的海量数据处理平台,主要提供数据上传和下载通道,提供 SQL 及 MapReduce等多种计算分析服务,同时还提供完善的安全解决方案。
MaxCompute 可以简单的认为是 MapReduce 以及Yarn。
DataWorks(数据工厂,原大数据开发套件)是基于 MaxCompute计算引擎的一站式大数据工厂,它能帮助您快速完成数据集成、开发、治理、服务、质量、安全等全套数据研发工作。
DataWorks 可以认为是一个拥有图形化界面的Hive。
三、RDS
阿里云关系型数据库Relational Database Service,简称 RDS,是一种稳定可靠、可弹性伸缩的在线数据库服务。
流程:
RDS服务器购买 —> RDS配置 —> 配置RDS白名单详情 —> 申请RDS外网地址 —> 连接mysql