【Tableau系列】Tableau Prep简介及基本使用

【Tableau系列】Tableau Prep简介及基本使用

前言

在当今数据驱动的时代,高效的数据准备是数据分析成功的关键。Tableau Prep作为一款强大的数据准备工具,凭借其直观的界面和强大的功能,为用户提供了高效、便捷的数据处理解决方案。本文将带你快速了解Tableau Prep的基础知识和基本使用方法,开启高效数据准备之旅。


一、Tableau Prep简介

在数据分析领域,数据准备是整个分析流程的基础,但往往也是最耗时、最繁琐的环节。数据的来源多样、格式复杂,常常存在缺失值、错误值、重复值等问题,这些问题如果不妥善处理,将直接影响数据分析的准确性和可靠性。为了帮助数据分析师和业务人员高效地完成数据准备工作,Tableau公司推出了一款强大的数据准备工具——Tableau Prep。
Tableau Prep是一款直观、简洁且智能的数据准备工具,它通过可视化界面让用户能够轻松地合并、清理、组织和分享数据。无论用户是否具备专业的数据准备技能,都可以借助Tableau Prep快速上手,完成复杂的数据准备工作。Tableau Prep由Prep Builder和Prep Conductor两款产品组成,其中Prep Builder专注于帮助用户快速、自信地合并、调整和清理数据以进行分析,实现自助式数据准备

二、主要特点

  1. 可视化数据准备:通过直观的界面操作数据,无需编写复杂代码
  2. 流程导向:以流程图形式展示数据处理步骤,逻辑清晰可见
  3. 与Tableau无缝集成:可直接将处理好的数据发布到Tableau Server/Online或保存为文件

三、数据处理操作及实例

1、数据连接

Tableau Prep支持连接多种数据源

1)文件类型:

  • Excel (.xlsx, .xls)
  • 文本文件 (.csv, .txt)
  • JSON
  • PDF (需Tableau 2020.2及以上版本)

2)数据库

  • SQL Server, MySQL, PostgreSQL
  • Oracle, Snowflake
  • Google BigQuery, Amazon Redshift
  • 其他ODBC/JDBC兼容数据库

3)云服务

  • Salesforce
  • Google Sheets
  • Tableau Server/Online数据源

点击“+”号选择需要处理文件的类型
在这里插入图片描述

如下图所示,选中要处理的数据,拖拽至数据预览区
在这里插入图片描述

2、清洗功能

1)处理缺失值

  • 识别空值/Null值
  • 填充默认值或插值
  • 删除包含空值的记录

点击数据右侧“+”号,添加清理步骤
在这里插入图片描述

按图片中的顺序点击,可以实现对空值的处理
在这里插入图片描述

在这里插入图片描述

2)数据类型转换

  • 字符串↔数字↔日期转换
  • 地理角色分配

点击图片中的数据类型,即可做转换
在这里插入图片描述

3)文本处理

  • 修剪空格

  • 大小写转换在这里插入图片描述

  • 字符串拆分/合并在这里插入图片描述

4)异常值处理

  • 基于统计方法识别离群值
  • 设定值范围过滤

5)去重处理

  • 识别完全重复记录在这里插入图片描述

  • 基于关键字段去重

三、并集(Union)功能

合并结构相似的多张表

  • 自动并集:拖放多张结构相同的表到流程中,Tableau Prep自动按列名匹配合并在这里插入图片描述

  • 手动并集:处理列名不同的情况;手动指定列对应关系;处理列数不同的情况(填充空值)

  • 应用场景:合并多个月份/年度的分表数据;整合多个分支机构的数据;组合相同结构的多个数据源

四、联接(Join)功能

关联不同结构的表格

1)联接类型:

  • L内联接(只保留匹配记录)在这里插入图片描述

  • 左联接(保留左表全部记录)在这里插入图片描述

  • 右联接(保留右表全部记录)在这里插入图片描述

  • 全外联接(保留所有记录)在这里插入图片描述

2)联接条件:

  • 单字段匹配
  • 多字段组合匹配
  • 模糊匹配(需配合计算字段)

3)联接结果验证:

  • 查看匹配/不匹配记录数
  • 检查联接后的数据样本

4)应用场景:

  • 关联事实表与维度表
  • 补充缺失的属性信息
  • 创建宽表(wide table)分析

五、转置(Pivot)功能

1)列转行(纵向装置)

  • 将多列合并为一列
  • 创建新的分类字段
  • 适合处理“宽表”变“长表”

2)行转列(横向转置)

  • 将分类字段值转为列名
  • 聚合相应数值
  • 适合创建交叉表

六、聚合

1)按分类字段汇总数值
2)支持各种聚合函数(SUM,AVG,COUNT等)

七、采样

1)快速预览大数据集的处理效果
2)提高处理效率

八、输出

点击“+”号选择“输出”
在这里插入图片描述
选择位置保存,以便后续的可视化处理
在这里插入图片描述

总结

总结来说,Tableau Prep 以其直观的界面和强大的数据预处理功能,为用户提供了高效、灵活的数据清洗与整合方案。无论是数据新手还是资深分析师,都能通过拖拽操作快速完成复杂的数据准备流程,从而将更多精力聚焦于分析与洞察。掌握 Tableau Prep,无疑是提升数据工作效率、释放数据价值的关键一步。

合并,整形和清理数据以使用Tableau Prep进行分析 Tableau Prep更改了组织中传统数据准备的执行方式。通过提供直观,直接的方式来组合,成形和清除数据,Tableau Prep使分析人员和业务用户更容易更快地开始分析。 Tableau Prep由两种产品组成:用于构建数据流的Tableau Prep Builder和用于在组织内调度,监视和管理流的Tableau Prep Conductor。 三个协调的视图使您可以查看行级数据,每一列的配置文件以及整个数据准备过程。根据手头的任务选择要与之交互的视图。 如果要编辑值,请选择并直接编辑。更改您的联接类型,并立即查看结果。每次执行操作时,即使是数百万行的数据,您都可以立即看到数据更改。通过Tableau Prep Builder,您可以自由地重新排序步骤并进行实验,而不会产生任何后果。 使用智能功能解决常见的数据准备挑战。Tableau Prep Builder使用模糊聚类将重复任务(例如按发音分组)转变为一键式操作。 无论是数据库还是电子表格,都可以连接到本地或云中的数据。无需编写代码即可访问,合并和清除不同的数据。Tableau Prep Builder会在可能的情况下智能地将操作推送到数据库,让您利用现有的数据库投资来提高流程执行性能。 留在您的分析流程中。使用Tableau Desktop打开输出或通过Tableau Server或Tableau Online与他人共享输出很容易。轻松共享可减少摩擦,并帮助您弥合数据准备和分析之间的鸿沟,以获得更好的业务成果。 使用Tableau Prep Conductor,您可以轻松地在服务器环境中发布和运行流。使用Tableau Server或Tableau Online安全共享您的数据源。创建一个环境,组织中的每个人都可以使用准备好的最新数据。 安排您的流量在白天或晚上需要时运行。使您的数据准备过程自动化,以便始终准备好新鲜数据并准备进行分析。 使用当今Tableau Server上可用的相同工具监视流。使用“状态”页面,“管理员视图”和运行历史记录来查看整个服务器上的流的运行状况,以便您可以快速解决任何问题。通过主动警报始终知道您的流量是否健康。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值