自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 ETL工具之Informatica

这里写自定义目录标题Informatica简介PowerCenter功能简介全量接数/调度/监控增量接数/调度/监控Informatica简介Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、大数据、数据质量控制、主数据管理、B2B Data Exchange、应用程序信息生命周期管理、复杂事件处理、超级消息和云数据集成。其下有众多产品,其中这...

2021-11-24 11:43:53 10430 1

原创 Oracle与Hive语法对比

在将oracle语法逻辑迁移到hive或者将hive语法逻辑迁移到oracle时,我们会面临语法不互通的问题,此时就需要了解语法逻辑进行转换加工之后才能以另外一种语法的逻辑实现.Oracle与Hive区别oracle是数据库,而hive是数据仓库,二者最大的区别就在于存储和计算.oracle数据库是支持存储计算功能的,Hive是基于hadoop的数据仓库工具,hive本身没有存储和计算能力,完...

2019-11-28 23:52:43 10669 5

原创 数据仓库---需求调研阶段

概况数据仓库建设的第一步就是调研,只有充分了解了客户的需求以及客户目前的一个业务/系统等状况,才能从广度和深度上做好需求调研为数据仓库建设建立良好的开端需求分类调研不同阶层: 通过对客户不同阶层的人员进行调研,更好地了解客户的问题及需求,以便于后期的建模工作更有针对性开展.具体人员: 由于业务人员不懂技术,它们以为需求都会得到满足。各个项目开发人员不懂业务,不熟悉整个业务场景。数据仓库团...

2019-09-29 18:05:33 2698

原创 浅谈数仓建模及其方法论

认识数据仓库1.数仓的定义:2.数据仓库和数据库的区别:数仓的发展1.简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。这个阶段的大部分表现形式为数据库和前端报表工具。2.数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提...

2019-09-21 12:09:44 5591 1

原创 ETL必知必会----正则

ETL简介ETL(Extraction-Transformation-Loading)中文意思就是数据清洗(数据抽取、转换和加载),通俗的说法就是从数据源抽取数据出来,进行清洗加工转换,然后加载到定义好的数据仓库模型中去。目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节,其设计的好坏影响生成数据的质量,直接关系到BI项目的成败。这...

2019-08-30 18:58:39 1143

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除