- 博客(3)
- 收藏
- 关注
原创 大数据项目之企业级数据仓库实战
数据库(Database)是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据指的是以一定的数据模型组织、描述和储存在一起、具有尽可能小的冗余度、较高的数据独立性和易扩展性的特点并可在一定范围内为多个用户共享。常用的数据库有 MySQL、ORACLE、SQL Server 等数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。
2022-11-24 20:21:44 273
原创 大数据开发之数仓建模
每个行业都有自己的模型,但不难发现,在数据建模的方法上,它们都有着共通的基本特点。文章主要分以下几个方面来简单帮助大家了解整个数仓建模的过程。数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里,数据模型表现的抽象是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。
2022-11-24 18:03:16 401
原创 大数据之HADOOP(HDFS)详解(一)
(1)HDFS产生背景当数据量越来越大时,许多网络公司就要考虑到一个问题,该如何存储这些数据?于是,当一个操作系统存不下所有的数据时,他们就把数据分配到更多操作系统所管理的磁盘中去;但这样也有一定的不便之处,那就是多个操作系统并不利于管理和维护;这个时候,就迫切需要一种系统去管理多台机器上的文件,这就是分布式管理系统。要注意,我们这里说的HDFS只是分布式管理系统的一种。(2)HDFS的定义。
2022-11-09 13:32:43 210
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人