GreenPlum
越努力越幸运再努力
这个作者很懒,什么都没留下…
展开
-
第九章 数据库管理
9.1 用户及权限管理9.1.1 Greenplum 数据库逻辑结构图9-1在 gp/pgsql 中,角色(Role)、模式(Schema)、数据库(DataBase)是三个不同的概念,不同于 Mysql 的 DataBase 等同于 Schema,Oracle 的 Role 等同于 Schema。在 gp 中:一个 database 下可以有多个 schema。schem...原创 2019-11-28 08:55:46 · 332 阅读 · 0 评论 -
第八章 Greenplum 线上环境部署
本章开始讲解如何搭建一个高性能、安全可靠、可扩展、可管理的 Greenplum 集群。8.1 服务器硬件选型数据库服务器硬件选型应该遵循以下几个原则:(1)高性能原则保证所选购的服务器,不仅能够满足现有应用的需要,而且能够满足一定时期内业务量增长的需要。对于数据库而言,数据库性能依赖于硬件的性能和各种硬件资源的均衡,CPU、内存、磁盘、网络这几个关键组件在系统中都很关键,如果过分突...原创 2019-11-28 08:42:50 · 318 阅读 · 0 评论 -
第七章 Greenplum 架构介绍
本章主要从并行计算和并行数据库入手来分析 Greenplum 架构的特性。7.1 并行和分布式计算1、并行计算并行计算(Parallel computing)一般是指许多指令同时进行的计算模式。相对于串行计算, 并行计算可以划分成时间并行和空间并行。时间并行即流水线技术,空间并行使用多个处理器执行并发计算,当前演讲的主要是空间的并行问题。空间上的并行导致两类并行机器的产生,即单指令流多...原创 2019-11-28 08:42:29 · 702 阅读 · 0 评论 -
第六章 Greenplum 高级应用
本章将介绍一些 Greenplum 的高级特性,主要是与其他关系型数据库有区别的地方。当今的数据处理大致可以分成两大类:联机事务处理OLTP(On-Line Transaction Processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理。OLAP是数据仓库系统的主要应用,支...原创 2019-11-27 17:07:44 · 998 阅读 · 0 评论 -
第五章 执行计划详解
gp 是基于 pgsql 开发的,其执行计划大多是跟 pgsql 一样的,但由于 gp 是分布式并行数据库,在 sql 执行上有很多 MPP 的痕迹,因此在理解 gp 的执行计划时,一定要将其分布式框架熟读在心,从而能够通过调整执行计划给 sql 带来很大的性能提升。5.1 执行计划入门5.1.1 什么是执行计划执行计划就是数据库运行 sql 的步骤,相当算法,读懂 gp 的执行计划,...原创 2019-11-27 17:03:56 · 3052 阅读 · 2 评论 -
第四章 数据字典详解
gp 是基于 PostgreSQL开发的,大部分数据字典是一样的;gp 也有自动的一些数据字典,一般是以 gp_ 开头4.1 oid 无处不在oid 是一种特殊的数据类型,在 PG/GP 中,oid 都是递增的,每一个表空间、表、索引、数据文件名、函数、约束等都对应有一个唯一标识的 oid。oid 是全局递增的,可以把 oid 想象成一个递增的序列(SEQUENCE)通过下面的语句可以...原创 2019-11-27 17:02:43 · 5637 阅读 · 0 评论 -
第三章 Greenplum 实战
3.1 历史拉链表数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。优于需要反映历史变化,数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。历史拉链表是一种数据模型,主要是针对数据仓库设计中标存储数据的方式而定义的,就是记录一...原创 2019-11-27 17:00:02 · 849 阅读 · 0 评论 -
第二章 greenplum 快速入门
2.1 软件安装及数据库初始化2.1.1 greenplum 架构1Master主机与Segment主机对比:Master主机负责 Segment主机负责 1. 建立与客户端的会话连接和管理 1. 业务数据的存储和存取 2. sql的解析并形成分布式的执行计划 2. 执行由master分发的sql语句 3. 将生成好的执行计划分发到每个Segmen...原创 2019-11-27 16:50:17 · 1346 阅读 · 0 评论 -
第一章 greenplum简介
1.1 greenplum的起源和发展历程针对数据密集型计算中的海量数据处理这一高效的数据管理功能。比较典型的解决方案有Teradata、Greenplum、Hadoop Hive、Oracle Exadata、IBM Netteza等1.2 OLTP与OLAP数据库系统一般分为两种类型:OLTP、OLAP:OLTP(On-Line Transaction Processing,联...原创 2019-11-27 16:48:38 · 337 阅读 · 0 评论 -
GreenPlum 介绍
一、Greenplum 是什么 是一款开源的分布式数据库存储解决方案,其主要关注在数据仓库和商业智能方面。可以在虚拟化x86服务器上运行无分享(shared-nothing)的大规模并行处理(MPP)架构。Greenplum最早是在10多年前(大约在2002年)出现的,基本上和Hadoop是同一时期(Hadoop 约是2004年前后,早期的Nutch可追溯到2002年)。当时的背...原创 2019-11-27 16:47:32 · 1788 阅读 · 0 评论