先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
正文
数据模型
在Tablue中数据分为两层,逻辑层和物理层
- 在“数据源”页面画布中看到的默认视图是数据源的逻辑层,使用关系(或“关系线”)来合并逻辑层中的数据
- 物理层,使用联接和并集在物理层的表之间合并数据,双击逻辑表就可以查看物理表
逻辑表
具有多个相关表的数据源的顶级视图。这是逻辑层。可以使用关系(“关系线”)来合并逻辑表。它们不使用联接类型。它们就像物理表的容器。
物理表
双击逻辑表可将其打开并查看其物理表。可以使用联接或并集合并物理表。在此示例中,“Book”(书籍)逻辑表由三个联接的物理表(“Book”(书籍),“Award”(奖项)、“Info”(信息))组成。
在以前版本的 Tableau 中,数据模型只有物理层。在 Tableau 2020.2 及更高版本中,数据模型具有逻辑(语义)层和物理层。
在以前的版本中,表之间的直接进行物理层面的关联,结果会保存到数据源中,源数据将不再独立。在现在的版本中 逻辑层中的表不会合并到数据源中,它们保持独立(规范化)也便于以后操做。
逻辑表充当已合并物理表的容器。逻辑表可以包含单个物理表。或者,它可以包含通过联接或并集合并在一起的多个物理表。
关系和关联
关系
关系是为分析合并来自多个表的数据的一种动态、灵活的方式。关系描述两个表如何基于公共字段相互关联,但不将表合并在一起。在表之间创建关系时,表将保持独立,同时保持其单独的详细级别和域。
- 显示为逻辑表之间的灵活关系线
- 需要您选择两个逻辑表之间的匹配字段
- 不需要您选择联接类型
- 使关联表中的所有行和列数据在数据源中可能可用
- 在数据源中和分析期间保留每个表的详细级别
- 在多个详细级别创建独立域。在数据源中,表不会合并在一起。
- 在分析期间,根据正在使用的字段自动创建相应的联接。
- 不会重复聚合值(当性能选项设置为“多对多”时)
- 保留不匹配的度量值(当性能选项设置为“某些记录匹配”时)
联接
联接是一种更静态的数据合并方式。联接必须在分析之前提前在物理表之间定义,并且不能在不影响使用该数据源的所有工作表的情况下进行更改。联接的表始终合并为单个表。
- 在物理表之间显示时带有维恩图图标
- 需要您选择联接类型和联接子句。
- 联接的物理表将合并到具有固定数据组合的单个逻辑表中
- 可能会删除不匹配的度量值
- 如果字段处于不同的详细级别,则可能会导致聚合值重复
- 支持需要单个数据表的方案,例如数据提取筛选器和聚合
关系相比联接的优势
- 使数据源更易于定义、更改和重用。
- 能够以正确的详细级别 (LOD) 跨多个表分析更轻松地分析数据。
- 无需使用 LOD 表达式或 LOD 计算在不同详细级别进行分析。
- 仅查询具有当前可视化项中所使用字段的表中的数据。
使用关系的要求
- 在关联表时,定义关系的字段必须具有相同的数据类型。更改“数据源”页面中的数据类型不会更改此要求。Tableau 仍将使用基础数据库中的数据类型进行查询。
- 不能基于地理字段定义关系。
- 数据模型中不支持循环关系。
- 无法定义已发布数据源之间的关系
具体的讲解还是请大家移步官方文档
连接方式
- 实时连接
每次的刷新图表都会从远程加载数据,实时性较高 - 数据提取
就是将远程的数据加载到本地,以后数据将会从本地获取,同样也可以进行手动刷新,将远程的数据保存到本地需花费时间,实时性较差
数据预处理
重命名&设置别名
为了以后的操做我们可以在数据源的部分将部分的字段改成我们想要的数据名,同样也可以指定对应的数据类型。
拆分字段
有时候一个字段中数据可以拆分成两个有用的数据,我们可以通过指定分割符来进行拆分字段,拆分后的字段会添加到表的最后列。
创建字段&合并字段&计算字段
这三个操做的做法和目的都是一样的,都是在原表中添加一个新的字段
这个操做我们可以通过创建计算字段
进行实现
合并字段
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
p204888 (备注大数据)**
[外链图片转存中…(img-NsYNEvzl-1713408287064)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!