自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 四.Matplotlib

Matplotlib 是一个用于 Python 编程语言和其数值数学扩展 NumPy 的绘图库。它提供了一个面向对象的 API,用于嵌入到应用程序中的图形,并且可以生成多种硬拷贝格式和交云平台的交互式环境。Matplotlib 可以用于 Python 脚本、Python 和 IPython shell、Jupyter notebook、Web 应用服务器以及多种图形用户界面工具包。Matplotlib 是数据科学和人工智能领域中使用最广泛的 Python 数据可视化库之一。

2024-04-11 13:43:50 1906

原创 三.Numpy

视图操作允许我们以不同的方式查看和操作数组的数据,而不会创建新的数组对象。通过创建数组的视图,我们可以改变数组的维度、形状、步长和数据类型,以满足不同的需求。

2024-04-11 13:35:59 1563

原创 二.Jupyter Notebook

【代码】二.Jupyter Notebook。

2024-04-11 13:35:13 119

原创 一.Anaconda

清华镜像源:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/conda。

2024-04-11 13:31:19 157

转载 hive中regexp_extract的用法总结

  1。regexp_extract 语法:    regexp_extract(string subject,  string pattern,  int index) 返回值: string 说明:  将字符串subject按照pattern正则表达式的规则拆分,返回index指定的字符...

2021-04-06 09:36:56 722

转载 数据仓库-拉链表,流水表,全量表,增量表

转载声明 本文大量内容系转载自以下文章,有删改,并参考其他文档资料加入了一些内容: 数据仓库中的增量表,全量表,快照表,拉链表 作者:北京小辉出处:csdn 什么是全量表,增量表,快照表,拉链表? 作者:泽米出处:csdn 一文搞定数据仓库之拉链表,流水表,全量表,增量表 作者:mtj66出处:csdn 数据仓库中的全量表,增量表,拉链表,流水表及快照表 作者:大数据私房菜出处:csdn 1 增量表 1.1 概念 增量表:新增数据,增量数据是上次导出.

2021-02-25 09:43:06 834 1

转载 数仓中的全量表,增量表,拉链表,流水表,快照表

预热:我们先从几个物理概念入手理解什么是流量,存量,增量(1)存量:系统在某一时点时的所保有的数量;(2)流量:是指在某一段时间内流入/出系统的数量(3)增量:则是指在某一段时间内系统中保有数量的变化(4)增量=流入量–流出量(5)本期期末存量=上期期末存量+本期内增量正题一般公司只是简单分成 全量表,增量表,和拉链表。所以重点关注如下三个表就OK了。全量表:每天的所有的最新状态的数据。(1)全量表,有无变化,都要报(2)每次上报的数据都是所有的数据(变化的 + 没有变化的)增量表

2021-02-25 09:41:02 409

转载 数据仓库中拉链表和流水表

前言 本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。 全文由下面几个部分组成: 先分享一下拉链表的用途、什么是拉链表。 通过一些小的使用场景来对拉链表做近一步的阐释,以及拉链表和常用的切片表的区别。 举一个具体的应用场景,来设计并实现一份拉链表,最后并通过一些例子说明如何使用我们设计的这张表(因为现在Hive的大规模使用,我们会以Hive场景下的设计为例)。 分析一下拉链表的优缺点,并对前面的提到的一些内容进行补充说明,比如说拉链表和流水.

2021-02-24 17:03:17 677

转载 数据仓库拉链表

增量数据与历史库做成拉链表 首先介绍几个表概念: 全量表:每天的所有的最新状态的数据 增量表:每天的新增数据 拉链表:维护历史状态,以及最新状态数据 流水表:对于表中的每一个修改都会记录,可以用于反映实际记录的变更 拉链表VS流水表: 拉链表:通常是对帐户信息的历史变动进行处理保留的结果;用于统计业务相关情况流水表:每天的交易形成的历史;用于统计账户及客户的情况 在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 数据量比较大; 表中的部分..

2021-02-24 16:52:17 135

转载 多对多维度或多值维度

多对多维度或多值维度 维度表和事实表之间的标准关系是一对多关系,这意味着维度表中的一行记录会连接事实表中的多行记录,但是事实表中的一行记录在维度表中只关联一行记录。这种关系很重要,因为它防止了重复计数。幸运的是,在大多数情况下都是这种一对多关系。 在现实世界中还存在比一对多关系更复杂的两种常见情况: 事实表和维度表之间的多对多关系。 维度表之间的多对多关系。 这两种情况本质是相同的,但事实表和维度表之间的多对多关系少了唯一描述事实和维度组的中间维度。 对于这两种情况,我们介绍一种称为桥接表的中间表,以.

2021-02-24 15:53:37 518

转载 第三篇:数据仓库系统的实现与使用(含OLAP重点讲解)

阅读目录 前言创建数据仓库ETL:抽取、转换、加载OLAP/BI工具数据立方体(Data Cube)OLAP的架构模式小结 回到顶部 前言         上一篇重点讲解了数据仓库建模,它是数据仓库开发中最核心的部分。然而完整的数据仓库系统还会涉及其他一些组件的开发,其中最主要的是ETL工程,在线分析处理工具(OLAP)和商务智能(BI)应用等。     &nbs..

2021-02-24 15:50:40 277

转载 第二篇:数据仓库与数据集市建模

阅读目录 前言维度建模的基本概念维度建模的三种模式实例:零售公司销售主题的维度建模更多可能的事实属性经典星座模型缓慢变化维度问题数据仓库建模体系之规范化数据仓库数据仓库建模体系之维度建模数据仓库数据仓库建模体系之独立数据集市三种数据仓库建模体系对比小结 回到顶部 前言         数据仓库建模包含了几种数据建模技术,除了之前在数据库系列中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。..

2021-02-24 15:48:36 219

转载 第一篇:数据仓库概述

阅读目录 前言数据库的"分家"操作型数据库 VS 分析型数据库数据仓库(data warehouse)定义数据仓库组件数据集市(data mart)数据仓库开发流程小结 回到顶部 前言         阅读本文前,请先回答下面两个问题:         1. 数据库和数据仓库有什么区别?         2. 某大公司Hadoop Hive里的关系表..

2021-02-24 15:47:13 232

转载 数据仓库建模

前言         数据仓库建模包含了几种数据建模技术,除了之前在数据库系列中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。         本文将详细介绍数据仓库维度建模技术,并重点讨论三种基于ER建模/关系建模/维度建模的数据仓库总体建模体系:规范化数据仓库,维度建模数据仓库,以及独立数据集市。 回到顶部 维度建...

2021-02-24 15:44:23 219 1

转载 数据库建模三步骤:概念模型->逻辑模型->物理模型

数据库建模三步骤:概念模型->逻辑模型->物理模型 yimenglin 2020-07-22 10:22:12 ...

2021-02-24 15:33:45 3256

转载 数据仓库

数据仓库 什么是数据仓库? yimenglin 2020-07-06 08:46:23 11

2021-02-24 15:26:36 241

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除