本文属于【Azure Data Platform】系列。
接上文:【Azure Data Platform】ETL工具(5)——使用Azure Data Factory数据流转换数据
前面开篇第一章主要以初学者的角度去看ADF,本文以已经会基础操作的角度去重新介绍一下ADF,并且介绍主要组件之间的关系。
ADF 极简介绍
ADF 是什么?简单来说就是个图形化为主的创建自动化管道(pipeline)的服务。
那它能做什么?看下面的图:
说白了,ADF主要做两件事(不仅仅这两件):复制数据(Copy data)和转换数据(transform data)。
Copy Data:
复制数据是ADF的核心功能。可以从超过90中SaaS 应用, 本地数据源和云数据源中获取数据。 而且复制过程还能对数据的格式进行操作。
Transform Data:
在复制数据过程,还能进行数据转换,过去这些操作通常使用数据库的SQL/存储过程, Hadoop等工具来完成。 从2019年开始,引入了一个叫数据流(Data Flows&