【拉勾教育数据分析实战训练营】--Tableau学习笔记-重点回顾1
【拉勾教育数据分析实战训练营】--Tableau学习笔记-重点回顾1
以下是我搜罗的一些官方优秀case分享:
1、https://public.tableau.com/zh-cn/gallery/?tab=featured&type=featured
2、https://www.tableau.com/zh-cn/solutions/gallery?tab=featured&type=featured
3、 官方白皮书——哪种图表或图形是您的理想选择?(部分图表欣赏):
4、金融时报–图表字典:
2.1数据导入
注意:CSV/TXT可以自动读取同目录源下多个文件
2.2 数据预处理
2.2.1 规整数据
数据解释器:去除空行、标题等,智能识别数据表格;
2.2.2 数据格式设置
可以从数据预览区、管理元数据、工作表维度处进行设置
文本转日期
文本转数字
以数据预览区为例:
2.2.3 字段设置
列拆分:对有分隔符的列进行拆分,增加数据信息
转置/数据透视表:选中同一维度的多个标题列,转化为一列
别名:可方便不规范的数据统一别名
隐藏:隐藏不需要列
重命名:规范命名
2.3 数据联接
根据相同列字段,列合并;
类似Excel的vlookup,MySQL中的join,Pandas中的merge
联接是用于合并由通用字段关联的表的一种方法。使用联接合并数据后会产生一个通过添加数据列横向扩展的表。
2.3.1 联接方式(how)
左联接
右联接
内联接
外联接
2.3.2 联接字段(on)
用已有的字段联接
用计算字段联接
2.4 数据并集
数据列一致,行合并;
类似MySQL中的 union,Pandas中的concat
合并是一种将值(行)附加到表的方法。如果表具有相同的列,则可以合并这些表。使用并集合并数据后会生成一个虚拟表,此表具有相同的列,但会通过添加数据行进行纵向扩展。
直接拖拽:适合CSV文件
新建并集:在数据源页面上,双击**“新建并集”**以设置并集。
手动合并表新建并集:用此方法来手动合并不同的表。此方法允许您将单独的表从“数据源”页面的左侧窗格拖放到“并集”对话框中。
通配符新建并集:文件批量合并
2.5 数据源管理
2.5.1 数据源的两种读取方式
实时和数据提取的选择
什么情况下选择“实时”
源数据的保密性要求较高,处于安全考虑不希望保存到本地时,可以采取实时连接的方式。
需要实时更新源数据信息,并且对实时性的要求较高时,可以选择实时连接的方式。
什么情况下选择数据提取
不便于实时连接数据源,如数据是通过本地服务器获取,但又需要在别的电脑进行分析时,可以通过”数据提取“将所需分析的数据保存到本地。
分析的数据量较大,需要提高数据载入效率,降低源数据库的访问压力时,可以通过数据提取将数据转移到本地。
2.6 数据源合并(混合关系)
使用数据混合合并数据后会产生一个通过添加数据列横向扩展的虚拟表。每个数据源中的数据将聚合到公共级别,然后再一起显示在可视化项中。
2.6.1 如何创建混合关系?
顶部菜单栏”数据“ >> 编辑关系
若要在已连接到至少两个数据源的工作簿中创建混合,请将一个数据源中的字段置于工作表中 — 该数据源将成为主数据源。切换到另一个数据源,并在同一工作表上使用一个字段 — 该数据源将成为辅助数据源。数据窗格中将出现一个橙色链接图标,指明正在使用哪些字段来混合数据源。
蓝色的是主源,黄色的辅源,红色的纽带代表已成功联接的字段,灰色的纽带代表未联接成功的字段
3.1 分层
1.在“数据”窗格中,直接将字段拖放到另一个字段的顶部
2.出现提示时,请为该分层结构输入名称,并单击“确定”。
上钻或下钻,请执行以下操作:
在可视化项中,单击分层结构字段上的 + 或 - 图标。
3.2 分组
创建组以在字段中合并相关成员:如地区分组、学科分组;
通过在视图中选择数据来创建组
在视图中,选择一个或多个数据点,然后在出现的工具提示上单击组图标,也可以在工作区顶部的工具栏上选择组图标。
利用“数据”窗格中的字段来创建组
在“数据”窗格中,右键单击字段,然后选择**“创建”>“组”。
在“创建组”对话框中,选择要分组的多个成员,然后单击“分组”。
3.3 创建集
异常值处理,筛选器使用
在可视化项的视图中选择一个或多个标记(或标题)。
右键单击标记,并选择“创建集”。
3.4 创建参数
参数是全局占位符值,例如数字、日期或字符串,可以替换计算、筛选器或参考行中的常量值。
可以创建一个动态参数,该参数设置为自动刷新其当前值(依据独立于视图的单值计算的结果)或值列表(基于数据源列)。
在计算中使用参数
可通过参数来动态修改计算中的值。可以使用参数而不是手动编辑计算(以及所有依赖计算)。然后在要更改值时,可打开参数控件并更改值;使用该参数的所有计算都会更新。
若要在计算中使用参数,请将参数从“数据”窗格拖放到计算编辑器中,放在公式中的一个新位置,或替换当前公式的一个部分:
if [利润] >[盈利参数] then 'Profitable'
elseif [利润] = [盈利参数] then 'Breakeven'
else 'Loss'
end
在筛选器中使用参数
可通过参数来动态修改“前 N 个”筛选器中的值。
“筛选器”对话框**“前”**选项卡上的下拉列表中有一个参数列表。选择要在筛选器中使用的参数。
在参考线中使用参数
可通过参数来动态修改参考线。
“添加参考线、参考区间或框”对话框的“值”下拉列表中有一个参数列表。选择要使用的参数。
延伸示例1-用参数控制度量切换
运用参数控制度量切换的基本思路如下:
【拉勾教育数据分析实战训练营】--Tableau学习笔记-重点回顾1相关教程