![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据仓库工程师
数据分析小Y
学习BI、数据仓库、数据分析、机器学习。
毕业4年,从应届生到BI数据分析师老油条,不定期将过去自己求职积累经验和数据分析学习相关的一些笔记分享给大家,对互联网数据分析、机器学习有兴趣的朋友也可以关注我的工重号:python数据分析和机器学习,专注BI、数据分析和机器学习的学习和实践
展开
-
informatica的Filter组件学习笔记,mark一下
Filter组件概述转换类型:已连接、主动 过滤器转换允许您过滤映射中的行。通过过滤器转换从源转换传递所有的行,然后为转换输入过滤条件。所有过滤器转换中的端口均为输入/输出端口,只有符合条件的行才能通过过滤器转换。 在某些情况下,数据写入目标前需要基于一个或多个条件对其进行过滤。例如,如果您有包含关于当前员工信息的人力资源目标,可能希望过滤出兼职员工和钟点工。 下面的映射通过过滤器转换从包含员工数据的人力资源表传递行。过滤器仅允许薪水为 $3...原创 2020-10-19 23:01:14 · 764 阅读 · 0 评论 -
[数据仓库建模] 事实表的类型(可加,半可加,不可加)
众所周知,数据仓库的事实表中是有数字度量的,一般会根据这些数据度量以及提前规定好的一致性维度来进行统计等工作。那么事实表中的数组度量分三种:1.可加事实,2.半可加事实,3.不可加事实下面让我们来看看它们的定义与区别1.可加事实可加事实指的是该度量可以按照和事实表关联的任一维度进行汇总。比如商品的单价,可以按照品类维度进行汇总,按照店铺维度进行汇总等等。2.半可加事实指的就是该度量在某些维度下不可进行汇总,或者说汇总起来没有意义,比如说价差额,价差额在时间维度下的汇总就没有意义。记录静态数据(原创 2020-09-10 23:26:52 · 1606 阅读 · 0 评论 -
数据工程师面试题目集锦:Hive相关
大数据相关1 nosql和sql区别SQL数据库:在使用之前需要定义表的一个模式在表中存储相关联的数据支持join多表查询提供事务使用一个强声明性语言查询提供足够的支持,专业技能和工具NoSQL数据库:将相关联的数据存储在类似JSON格式,名称-值可以保存没有指定格式的数据保证更新一个文档,但不是多个文档提供出色的性能和可伸缩性使用JSON数据对象查询a 存储方式S...原创 2020-05-08 00:25:06 · 782 阅读 · 0 评论 -
数据仓库工程师面试题目(不定期更新)
1 缓慢变化维的设计?(真心常问,标准答案必备)三种:直接覆盖,增加新行,增加心属性列Type 1:覆盖:直接用新值代替旧值。Type 2:增加新行。将当前行的状态设置为off,并设置一个endtime时间戳,将当前时间标记上。同时新增1行,将其状态标记为on,设置begintime时间戳为上一个记录的endtime+1。Type 3:增加新列:给表增加一个新列,来存储新值,同时保留原来...原创 2020-04-30 00:08:53 · 10111 阅读 · 0 评论