自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

转载 关于数据治理

目录 1、什么是数据治理 2、数据治理的目的 3、数据治理的方法 4、数据质量8个衡量标准 5、数据治理流程 1、什么是数据治理 数据治理(Data Governance)是组织中涉及数据使用的一整套管理行为。由企业数据治理部门发起并推行,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。 数据的质量直接影响着数据的价值,并且直接影响着数据分析的结果以及我们以此做出的决...

2022-04-29 11:01:48 419

翻译 olap的12条准则

OLAP的12条准则1:模型必须提供多维概念视图分析用户能自然的视企业为一个多维模型,例如,利润可以按区域,产品,时间,或方案(如实际,预算或预测)查看。多维数据模型能让用户更直接和方便的操作数据,包括“切片和切块”2:透明性当OLAP以用户习惯的方式提供电子表格或图形显示时,这对用户应该是透明的。OLAP应该是开发系统架构的一部分,这个架构能按用户的需要嵌入到任何地方,而不会对主机工具的功能产生副作用。用户不应该接触到提供给OLAP工具的数据源,这些数据可能是同构的或是异构的3:存取能力准则O

2022-04-28 17:07:37 749

转载 OLAP与OLTP的区别?

1. OLAP与OLTP的区别? OLTP(Online transaction processing):在线/联机事务处理。典型的OLTP类操作都比较简单,主要是对数据库中的数据进行增删改查,操作主体一般是产品的用户。 OLAP(Online analytical processing):指联机分析处理。通过分析数据库中的数据来得出一些结论性的东西。比如给老总们看的报表,用于进行市场开拓的用户行为统计,不同维...

2022-04-28 16:28:21 64239 1

转载 M olap 与 R olap的区别

M&R OLAP OLAP(on-Line Analysis Processing)是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。 OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"维"这个概念。“维”(dimension)是人们观察客观世界的角度,是一种高层次的类型划分。“维”一般包含着层次关系,这种层次关系有时会相当复杂。通过把一个实体的多项重要的属性定义为多个维(dimension)

2022-04-28 14:09:39 374

转载 CAP原则

CAP原则CAP原则又称CAP定理,指的是在一个分布式系统中,一致性(Consistency)、可用性(Availability)、分区容错性(Partition tolerance)。CAP 原则指的是,这三个要素最多只能同时实现两点,不可能三者兼顾一致性一致性指的是分布式系统完成某个写操作时,服务器的各个都应该获取到最新的值,保持各个节点之前的数据一致性可用性可用性指的是在分布式系统中,用户可以永远在正常时间内进行读和写操作,一直可以正常访问并得到响应分区容错性分区容错性是指,在分布式系

2022-04-28 13:56:03 497

转载 ORC与PARQUET的区别

ORC与Parquet均为列式存储结构,那么他们有什么不同呢? Apache Parquet 源自google Dremel 系统,Parquet 相当一Dremel中的数据存储引擎,而Apache顶级开源醒目 Drill正式Dremel的开源实现. Apache Parquet 最初的设计动机是存储嵌套式数据,比如Protocolbuffer thrift json 等 将这类数据存储成列式格式以方便对其...

2022-04-28 13:47:07 7488

转载 CSDN如何进行转载

问题: 在CSDN中如何快速转载文章 解决步骤: 1.在CSDN中找到想要转载的文章,右击点击"检查"(或者快捷键F12) 出现以下界面(图下图右侧所示) 2.按住Ctrl+F快捷键,寻找"article_content" 3.选中div id="article_conte...

2022-04-28 13:35:27 1096 1

转载 什么是大数据lambda架构

一、什么是Lambda架构 Lambda架构由Storm 的作者 [Nathan Marz] 提出, 根据维基百科的定义,Lambda 架构的设计是为了在处理大规模数据时,同时发挥流处理和批处理的优势。通过批处理提供全面、准确的数据,通过流处理提供低延迟的数据,从而达到平衡延迟、吞吐量和容错性的目的。为了满足下游的即席查询,批处理和流处理的结果会进行合并。 二、Lambda架构组成 Lambda 架构包含三层...

2022-04-28 13:21:54 638

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除