目录
(三)将“源目标库”资料抛转到“目标数据库”表中(输出数据)
理解:
相当于ETL工具。
tableau desktop针对数据呈现,tableau prep builder针对数据处理(ETL)。
一、登录
点击“加号”图标 > 选择伺服器类型 > 输入伺服器信息 > 点击“登入”
二、操作
(一)创建流程
注意:针对需发布的流程,通常一个prep文件对应只做一个流程(即只做一个自订SQL流程,来搭配一个线上排程)
(若只是本地测试时,制作如下图的多个自订SQL也是可以的)
(二)创建SQL,捞取数据(输入数据)
双击左下角的“自订SQL”,或 拖拽“自订SQL”到空白区。即可看到空白区呈现下方红色圈住的方框内容。
然后,在“自订SQL”输入框中,输入SQL查询语句,点击“执行”。
查看数据结果是否有遗漏。
(三)将“源目标库”资料抛转到“目标数据库”表中(输出数据)
即,将拷贝一份查询得到的数据,存储在新数据库表中。
1. 点击“加号”图标,选择“输出”
2. 输出界面如下图
3. 选择输出位置
选择“资料库” > 新增连线 > 选择连线方式 > 输入数据库链接信息 > 选择输出的表位置。
可以选择已有表,也可以新建表。
4. 输出表选择好后,选择“写入选项”
① 写入选项有两种形式:“完整重新整理”、“累加式重新整理”
注意:若想呈现“累加式重新整理”形式,则需点击SQL图标,进入“设定”,勾选“启用累加式重新整理“,选择”输入栏位“。
还有,“累加式重新整理”需要以SQL查询结果的时间为基础。
最后,点击输出图标,切换回到“输出”界面。即可呈现“累加式重新整理”形式了。
② 抛转数据的方式有三种:建立表、附加至表、取代资料
两种写入形式+三种抛转方式的特点
以下是官方文档撰写的表格,路径如下: Tableau > 说明 > Tableau Prep 说明> 储存和共用工作 > 使用累加式重新整理流程资料
(详情可参考文章:使用累加式重新整理重新整理流程資料 - Tableau)
重新整理組合 | 已處理的資料 | 資料表更新 | 優點 |
---|---|---|---|
完整重新整理 + 建立資料表 | 全部 | 使用完整資料集建立或覆寫現有資料表。 | 重新整理每次執行流程的所有資料。 |
完整重新整理 + 附加至資料表 | 全部 | 新增列至現有資料表。 | 追蹤每個執行流程中的新資料和現有資料。附加至資料表不適用於 .csv 輸出類型。 |
完整重新整理 + 取代資料 | 全部 | 取代現有資料表中的列。 | 保留現有資料表架構結構,但取代每次執行流程的所有資料。 |
遞增重新整理 + 建立表 | 僅限新列 | 僅使用新列建立或覆寫現有資料表。 | 僅使用新列作為完整資料集,來建立新資料表。 如果流程執行時輸出資料來源不存在或無法連線,則流程將失敗。需要完全重新整理才能建立輸出,然後才能對其進行累加式使用。 |
遞增重新整理 + 附加至表 | 僅限新列 | 新增新列至現有資料表。 | 僅新增新列至現有資料表。附加至資料表不適用於 .csv 輸出類型。請參閱使用「附加」進行累加式重新整理。 |
累加式重新整理 + 取代資料 | 僅限新列 | 僅使用新列取代現有資料表中的所有列。 | 保留現有資料表架構結構,但僅使用新列取代所有資料,使新列成為完整資料集。 |
5. 执行流程
可以选择“箭头”,单独点击即可执行其中一个。执行完成后,可以在目标数据库中查看。
三、发布
当流程制作完成后,需将本地流程上传到server上。
作用:为了后期的线上排程。