2021-01-31

                         数据仓库相关

数据仓库:在计算机领域,数据仓库也被称为企业数据仓库(EDW),主要用于报表和数据分析系统,是商业智能的核心组成部分。
数据仓库是一个中央存储库,里面存储来自一个或多个不同数据源的整合数据。数据仓库存储当前和历史数据,为贯穿整个企业的知识性员工创建分析型报告。比如这些报告可以是构建在日常销售分析基础上的年度或季度对比趋势,存储在仓库中的数据来自于业务系统(比如营销或销售系统)。

数据集市:是数据仓库的一种简单形式,里面集中存储了某一个单一主题或功能区域的数据。数据集市的裸数据来自于一些有限的数据源,如销售财务或市场系统数据往往由一个组织内的某一个部门建立,并使用数据源可以是内部业务系统,一个中央数据仓库或外部数据规范化,是该系统中数据建模技术的常态,鉴于数据及时,经常仅覆盖数据仓库中数据的一个子集,他们往往更容易和更快速实现 。

在线分析处理(OLAP):在数据仓库中广泛使用,常用来分析来自多个数据源的多维数据。首要特点是在线密码比较少,查询经常比较复杂,并涉及到聚合。对OLAP系统来说,响应时间是一个重要指标。该系统广泛应用于数据挖掘技术,OLAP,数据库存储汇总和历史性数据在多维模型中经常使用星型模型。该系统通常具有几个小时的数据延迟而设计即逝的通常数据延迟接近一天。

数据仓库的概念最早可以追溯到20世纪80年代后期,当时IBM的研究员开发了业务数据仓库。后来经过不断发展,现金一些企业开始尝试使用传统数据仓库技术进行BI系统的构建也就是使用一条工具实现数据的导出,转换,清洗和装入工具,使用操作型数据存储(ODS)存储明细数据,使用数据集市和数据仓库技术实现面向主题的历史数据存储使用,多维分析工具进行前端展现以及使用数据仓库工具提供的挖掘引擎或基于单独的数据挖掘工具进行预测分析等。

传统数据仓库技术具有以下优点:
1.通过完善的数据清洗转换,保证了ods数据的准确性和一致性。
2.通过数据仓库技术提升了BI系统的性能。
3.通过多维分析展现工具,给客户提供了全面的多维分析报表统计和即时查询功能。
4.通过数据挖掘技术帮助客户灵活地进行预测分析。

传统数据仓库的缺点:
1.随着竞争的进一步加剧,企业需要对市场变化进行及时响应,对数据仓库的实效性要求越来越高,而传统数据仓库中的数据都是经过批量定期更新的,难以满足时效性的要求。
2.越来越多的一线用户需要使用数据仓库,而传统数据仓库用户通常只针对高端管理层或少数管理人员,更多的一线用户无法访问数据仓库。
3.业务系统越来越需要传统数据仓库直通,提供相应的分析能力,而传统数据仓库通常不会主动推送分析能力。
于是其开始使用动态数据仓库技术解决上述问题,动态数据仓库技术给企业带来了实时分析能力,大大提高了企业的竞争力。相比传统数据仓库,动态数据仓库具有以下优点:
1.一线用户可以动态的访问数据仓库,以便获取所需的信息。
2.使用动态数据加载方式相比传统数据仓库,采用批量形式加载数据,动态数据仓库通常以准实时的方式连续下载数据,从而在根本上保证数据仓库数据的实时性。
3.采用事件驱动和主动推送的方式为业务系统提供分析能力。

数据仓库的数据模型包括概念模型,逻辑模型和物理模型三个层次,目前对数据仓库数据模型的研究多集中在逻辑模型。

概念模型是客观世界到计算机系统的一个中间层次,最常用的表示方法是ER图。目前数据仓库一般是建立在数据库的基础之上,所以其概念模型与一般关系型数据库的概念模型一致。

逻辑模型是数据的逻辑结构,如关系模型和层次模型等数据仓库的逻辑模型是多维模型,描述了数据仓库主题的逻辑实现即每个主题对应的模式定义数据仓库的数据模型包括星型,雪花型,星型—雪花型。三者都是以事实表为中心,不同之处只是外围维表之间的关系不同而已。

星型模型的每个维度都对应唯一的维表,维的层次关系全部通过维表中的字段实现。

物理模型是逻辑模型的,具体实现如物理存取方式,数据存储结构,数据存放位置和存储分配等,在设计数据仓库的物理模型时,需要考虑提升的性能的技术,如表分区、建索引等。
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: 简洁性:Go语言的语法简单直观,易于学习和使用。它避免了复杂的语法特性,如继承、重载等,转而采用组合和接口来实现代码的复用和扩展。 高性能:Go语言具有出色的性能,可以媲美C和C++。它使用静态类型系统和编译型语言的优势,能够生成高效的机器码。 并发性:Go语言内置了对并发的支持,通过轻量级的goroutine和channel机制,可以轻松实现并发编程。这使得Go语言在构建高性能的服务器和分布式系统时具有天然的优势。 安全性:Go语言具有强大的类型系统和内存管理机制,能够减少运行时错误和内存泄漏等问题。它还支持编译时检查,可以在编译阶段就发现潜在的问题。 标准库:Go语言的标准库非常丰富,包含了大量的实用功能和工具,如网络编程、文件操作、加密解密等。这使得开发者可以更加专注于业务逻辑的实现,而无需花费太多时间在底层功能的实现上。 跨平台:Go语言支持多种操作系统和平台,包括Windows、Linux、macOS等。它使用统一的构建系统(如Go Modules),可以轻松地跨平台编译和运行代码。 开源和社区支持:Go语言是开源的,具有庞大的社区支持和丰富的资源。开发者可以通过社区获取帮助、分享经验和学习资料。 总之,Go语言是一种简单、高效、安全、并发的编程语言,特别适用于构建高性能的服务器和分布式系统。如果你正在寻找一种易于学习和使用的编程语言,并且需要处理大量的并发请求和数据,那么Go语言可能是一个不错的选择。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据小理

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值