tableau
tableau介绍
tableau可以做数据可视化,但可视化只是tableau的基操,数据赋能和数据探索才是tableau的正确打开方式
数据赋能:让业务一线也可以轻松使用最新数据
数据探索:通过统计分析和数据可视化,从数据发现问题,用数据验证假设
数据连接
本地文件
csv数据连接到文本
xls、xlsx连接到excel
数据库
下载数据库对应的驱动后,填写地址等参数连接到对应的数据库
最后会再次说明
连接方式
默认使用智能连接只需选择连接所用的数据字段即可
连接所用的字段可以通过函数进行计算和编辑
表格之间的连接原理在后续的sql会再次说明
课程中的连接,通过门店和日期进行内连接 因为门店id和日期可以唯一标识
提取方式
实时:每次计算都会连接一次数据库进行取数运算。因为tableau的本质是Vizal查询语言,每做一个操作就查询一次是可以实现的,但在数据量级较大的情况下会比较慢(public好像没有这个功能)
数据提取:
将当前连接所涉及的数据全部都查询提取到hype格式的数据提取(相当于Tableau自己的数据库和对应类型的文件)
如果保存为twbx格式,hyper会自动打包进twbx,是tableau自带数据
缺点是每次修改完数据源都要重新提取一遍数据,如果是实时,则不需要先提取,等你作图时它才会再提取
如果要将tableau上传到sever服务器,则必须使用提取的数据连接方式
其实大量级数据都要用数据提取,除了修改连接建,其他操作在工作表的视图界面都能操作
提取选项:
如果选择数据提取,tableau还支持对表格进行基于字段和函数的增量式刷新,提升数据提取的鑫能,但百万级以下的数据,除非频繁提取,否则一般不需要这样操作
连接筛选
可以在提取数据后进行预筛选,只保留筛选后的数据进行视图操作
保存类型
twb不包含数据
twbx内置数据到tableau的文件中
点提取但是还没有保存时,tableau会让你先保存提取的数据
数据处理
可以查看数据,进行排序,重命名,拆分等操作
这些操作在做图界面也可以完成
数据可视化原理
1.看图比看字快
2.对于可视化来说,数据有维度和度量两种类型
3.度量映射图形,维度负责区分
4.对度量和维度进行拖拽操作,从而完成可视化的图表的操作,是被称为tableau第一概念,是最重要的知识
5.可拖拽的区域主要有以下三个:
行列 行:将字段作为纵轴 列:将字段作为横轴 两者可以通过转置交换
标记卡 用来切换数据对应的视觉映射类型 调整图表颜色,标记,大小等展示细节
筛选器 将指定变量作为筛选条件