- 博客(16)
- 收藏
- 关注
原创 四.Matplotlib
Matplotlib 是一个用于 Python 编程语言和其数值数学扩展 NumPy 的绘图库。它提供了一个面向对象的 API,用于嵌入到应用程序中的图形,并且可以生成多种硬拷贝格式和交云平台的交互式环境。Matplotlib 可以用于 Python 脚本、Python 和 IPython shell、Jupyter notebook、Web 应用服务器以及多种图形用户界面工具包。Matplotlib 是数据科学和人工智能领域中使用最广泛的 Python 数据可视化库之一。
2024-04-11 13:43:50
1906
原创 三.Numpy
视图操作允许我们以不同的方式查看和操作数组的数据,而不会创建新的数组对象。通过创建数组的视图,我们可以改变数组的维度、形状、步长和数据类型,以满足不同的需求。
2024-04-11 13:35:59
1563
原创 一.Anaconda
清华镜像源:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/conda。
2024-04-11 13:31:19
157
转载 hive中regexp_extract的用法总结
1。regexp_extract 语法: regexp_extract(string subject, string pattern, int index) 返回值: string 说明: 将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符...
2021-04-06 09:36:56
722
转载 数据仓库-拉链表,流水表,全量表,增量表
转载声明 本文大量内容系转载自以下文章,有删改,并参考其他文档资料加入了一些内容: 数据仓库中的增量表,全量表,快照表,拉链表 作者:北京小辉出处:csdn 什么是全量表,增量表,快照表,拉链表? 作者:泽米出处:csdn 一文搞定数据仓库之拉链表,流水表,全量表,增量表 作者:mtj66出处:csdn 数据仓库中的全量表,增量表,拉链表,流水表及快照表 作者:大数据私房菜出处:csdn 1 增量表 1.1 概念 增量表:新增数据,增量数据是上次导出.
2021-02-25 09:43:06
834
1
转载 数仓中的全量表,增量表,拉链表,流水表,快照表
预热:我们先从几个物理概念入手理解什么是流量,存量,增量(1)存量:系统在某一时点时的所保有的数量;(2)流量:是指在某一段时间内流入/出系统的数量(3)增量:则是指在某一段时间内系统中保有数量的变化(4)增量=流入量–流出量(5)本期期末存量=上期期末存量+本期内增量正题一般公司只是简单分成 全量表,增量表,和拉链表。所以重点关注如下三个表就OK了。全量表:每天的所有的最新状态的数据。(1)全量表,有无变化,都要报(2)每次上报的数据都是所有的数据(变化的 + 没有变化的)增量表
2021-02-25 09:41:02
409
转载 数据仓库中拉链表和流水表
前言 本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。 全文由下面几个部分组成: 先分享一下拉链表的用途、什么是拉链表。 通过一些小的使用场景来对拉链表做近一步的阐释,以及拉链表和常用的切片表的区别。 举一个具体的应用场景,来设计并实现一份拉链表,最后并通过一些例子说明如何使用我们设计的这张表(因为现在Hive的大规模使用,我们会以Hive场景下的设计为例)。 分析一下拉链表的优缺点,并对前面的提到的一些内容进行补充说明,比如说拉链表和流水.
2021-02-24 17:03:17
677
转载 数据仓库拉链表
增量数据与历史库做成拉链表 首先介绍几个表概念: 全量表:每天的所有的最新状态的数据 增量表:每天的新增数据 拉链表:维护历史状态,以及最新状态数据 流水表:对于表中的每一个修改都会记录,可以用于反映实际记录的变更 拉链表VS流水表: 拉链表:通常是对帐户信息的历史变动进行处理保留的结果;用于统计业务相关情况流水表:每天的交易形成的历史;用于统计账户及客户的情况 在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 数据量比较大; 表中的部分..
2021-02-24 16:52:17
135
转载 多对多维度或多值维度
多对多维度或多值维度 维度表和事实表之间的标准关系是一对多关系,这意味着维度表中的一行记录会连接事实表中的多行记录,但是事实表中的一行记录在维度表中只关联一行记录。这种关系很重要,因为它防止了重复计数。幸运的是,在大多数情况下都是这种一对多关系。 在现实世界中还存在比一对多关系更复杂的两种常见情况: 事实表和维度表之间的多对多关系。 维度表之间的多对多关系。 这两种情况本质是相同的,但事实表和维度表之间的多对多关系少了唯一描述事实和维度组的中间维度。 对于这两种情况,我们介绍一种称为桥接表的中间表,以.
2021-02-24 15:53:37
518
转载 第三篇:数据仓库系统的实现与使用(含OLAP重点讲解)
阅读目录 前言创建数据仓库ETL:抽取、转换、加载OLAP/BI工具数据立方体(Data Cube)OLAP的架构模式小结 回到顶部 前言 上一篇重点讲解了数据仓库建模,它是数据仓库开发中最核心的部分。然而完整的数据仓库系统还会涉及其他一些组件的开发,其中最主要的是ETL工程,在线分析处理工具(OLAP)和商务智能(BI)应用等。 &nbs..
2021-02-24 15:50:40
277
转载 第二篇:数据仓库与数据集市建模
阅读目录 前言维度建模的基本概念维度建模的三种模式实例:零售公司销售主题的维度建模更多可能的事实属性经典星座模型缓慢变化维度问题数据仓库建模体系之规范化数据仓库数据仓库建模体系之维度建模数据仓库数据仓库建模体系之独立数据集市三种数据仓库建模体系对比小结 回到顶部 前言 数据仓库建模包含了几种数据建模技术,除了之前在数据库系列中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。..
2021-02-24 15:48:36
219
转载 第一篇:数据仓库概述
阅读目录 前言数据库的"分家"操作型数据库 VS 分析型数据库数据仓库(data warehouse)定义数据仓库组件数据集市(data mart)数据仓库开发流程小结 回到顶部 前言 阅读本文前,请先回答下面两个问题: 1. 数据库和数据仓库有什么区别? 2. 某大公司Hadoop Hive里的关系表..
2021-02-24 15:47:13
232
转载 数据仓库建模
前言 数据仓库建模包含了几种数据建模技术,除了之前在数据库系列中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。 本文将详细介绍数据仓库维度建模技术,并重点讨论三种基于ER建模/关系建模/维度建模的数据仓库总体建模体系:规范化数据仓库,维度建模数据仓库,以及独立数据集市。 回到顶部 维度建...
2021-02-24 15:44:23
219
1
转载 数据库建模三步骤:概念模型->逻辑模型->物理模型
数据库建模三步骤:概念模型->逻辑模型->物理模型 yimenglin 2020-07-22 10:22:12 ...
2021-02-24 15:33:45
3256
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人