连接数据:
连接excel文件,连接hive
连接hive时输入账号密码,sql初始化语句,然后选择架构,最后自定义SQL语句。
然后系统会加载元数据
切换到工作表,可以更改一些字段的属性。比如日期。
当数据量比较大的时候,建议点击数据,找到数据源进行数据提取。
数据提取:
数据提取时,可以编辑数据源筛选器,可以理解为SQL最后一行添加了Where限定条件。
数据提取的方式有两种:增量提取,完全提取。
增量提取要选取标志行:比如选择日期date为标志行,这就意味着,在下次刷新时只增加上次提取日期之后的日期。这里应该主要考虑增量刷新之后,是否会对数据源中的统计量有影响。
当数据源中有按照标志行进行聚合的量时,不建议增量提取。
完全提取,顾名思义。
制作表格:
筛选器的影响:主要考虑独立筛选器和连接上下文的筛选器。可以理解为直接拖入到筛选器的筛选器是一个并行的状态。但是连接了上下文就是一个顺序执行的状态,一层层递进。
复杂突变操作后续讨论。
服务器与平台对日期等筛选的不一致真的是比较恶心。
发布:
发布时,可以根据情况添加用户筛选器。对sever上的用户进行权限分批或单独的权限设置。
发布时,建议数据源嵌入表格。
选取增量刷新和完全刷新计划。
设置用户权限。
讨论:
希望哪位有关于tableau的一些本质上的东西能直接把链接甩过来。尤其对连接数据库对SQL语句这方面,提取,刷新,每一步充当什么样的角色,运行机制什么的,说的明明白白的最好了。