数据之路
文章平均质量分 79
燃烧的七月
这个作者很懒,什么都没留下…
展开
-
如何用multipass创建Ubuntu虚拟机?
Multipass 是一种灵活、强大的工具,可用于多种用途。 以最简单的形式,它可用于在任何主机上快速创建和销毁 Ubuntu VM(实例)。原创 2023-03-24 00:55:22 · 649 阅读 · 0 评论 -
如何理解数据仓库的四大特性?
我们知道数据仓库的四大特性: 面向主题的(Subject Oriented) 集成的(Integrate) 相对稳定的(Non-Volatile) 反映历史变化(Time Variant)那么,如何理解这四大特性呢?一.怎么理解数据仓库是面向主题的?首先理解主题这个概念抽象意义上:在较高层次上将企业信息系统中数据进行综合、归类分析利用。属于一个抽象概念,每一个主题基本对应一个宏观分析领域。逻辑意义上:主题(Subject)是对应企业中某一宏观分析领域...原创 2022-04-28 14:38:27 · 1333 阅读 · 0 评论 -
为什么企业需要数据仓库?
对于第一次踏入数据仓库领域的同学来说,会有很多基础概念不清晰,今天我们来熟悉一下这些基础概念。一、什么是数据仓库?数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,它用于支持企业或组织的决策分析处理。二、为什么需要数据仓库?我们来举个例子,假设2018年有一家电商公司A,刚刚成立,总共就两三个人,在2...原创 2022-04-28 13:57:04 · 1298 阅读 · 0 评论 -
常见的开窗函数
开窗函数与聚合函数计算方式一样,开窗函数也是对行集组进行聚合计算,但是它不像普通聚合函数那样每组只返回一个值,开窗函数可以为每组返回多个值。开窗函数的语法为:over(partition by 列名1 order by 列名2 ),括号中的两个关键词partition by 和order by 可以只出现一个。over() 前面是一个函数,如果是聚合函数,那么order by 不能一起使用。开窗函数主要分为以下两类:窗口函数OVER()指定一组行,开窗函数计算从窗口函数输出的结果集中各行的值。原创 2022-04-27 21:51:25 · 8595 阅读 · 0 评论 -
数据库行式存储和列式存储的区别
行式存储,列式存储原创 2022-04-27 21:46:58 · 1929 阅读 · 0 评论 -
浅谈数据库,数据仓库,数据中台
数据库,数据仓库,数据中台这些关于数据的概念性的东西,对于初学者来讲,非常容易混淆。在使用计算机的过程中,我们经常会遇见需要进行数据存储的场景,比如,通讯录数据,进销存数据。在数据量不是特别大的时候,我们通常采用excel文件形式、txt文件、word文档等形式来存储数据。当数据量越来越大时,这种个人常用的数据存储方式会变得不太方便更新,不方便查询等,因此,需要一种数据管理工具,对这些零散的数据进行管理。一、数据库数据库以一定的方式将数据存储在一起的、能提供给多个用户共享的数据集合。它给用户提供原创 2021-08-10 01:08:05 · 580 阅读 · 0 评论