平台要求
本主题描述了Pivotal Greenplum Database 6平台和操作系统软件要求。
重要提示:Pivotal并没有对开源版本的Greenplum数据库提供支持。Pivotal支持中心仅支持Pivotal Greenplum数据库。
操作系统
Pivotal Greenplum 6在以下操作系统平台上运行:
- Red Hat企业版Linux 64位7.x(请参阅以下注释)
- Red Hat企业版Linux 64位6.x
- CentOS 64位7.x
- CentOS 64位6.x
- Ubuntu 18.04 LTS
要点:在RedHat 6.x和CentOS 6.x系统上启用基于资源组的工作负载管理时,发现Greenplum数据库性能显著下降。此问题是由Linux cgroup内核bug引起的。此内核bug已在CentOS 7.x和Red Hat 7.x系统中修复。
如果您使用RedHat 6,并且于您的使用案例而言,可以接受启用资源组时的性能,那么请将内核升级到2.6.32-696版或更高版本,以受益于cgroups实现的其他修复。
注释:对于在7.3之前的Red Hat Enterprise Linux 7.x或CentOS 7.x上安装的Greenplum数据库,操作系统问题可能会导致正在运行大量工作负载的Greenplum数据库挂起。此Greenplum数据库问题是由Linux内核bug引起的。
RHEL 7.3和CentOS 7.3解决了该问题。
Greenplum数据库服务器在RHEL/CentOS系统上支持TLS版本1.2,在Ubuntu系统上支持TLS版本1.3。
软件依赖关系
- apr
- apr-util
- bash
- bzip2
- curl
- krb5
- libcurl
- libevent
- libxml2
- libyaml
- zlib
- openldap
- openssh
- openssl
- openssl-libs (RHEL7/Centos7)
- perl
- readline
- rsync
- R
- sed (used by gpinitsystem)
- tar
- zip
- apr
- apr-util
- libyaml
- libevent
- libapr1
- libaprutil1
- bash
- bzip2
- krb5-multidev
- libcurl3-gnutls
- libcurl4
- libevent-2.1-6
- libxml2
- libyaml-0-2
- zlib1g
- libldap-2.4-2
- openssh-client
- openssh-client
- openssl
- perl
- readline
- rsync
- sed
- tar
- zip
- net-tools
- less
- iproute2
Greenplum Database 6使用Python 2.7.12,该产品包含在产品安装中(而不是作为软件包依赖项安装)。
要点:SSL仅支持Greenplum数据库master主机 。它不能在segment主机上使用。
要点:对于所有Greenplum数据库主机系统,必须禁用SELinux。您也应该禁用防火墙软件,尽管如果出于安全目的需要也可以启用防火墙软件。请参阅禁用SELinux和防火墙软件。
Java
- Open JDK 8或Open JDK 11,可从AdoptOpenJDK获得
- Oracle JDK 8或Oracle JDK 11
硬件与网络
下表列出了在生产环境中的Linux系统上支持Greenplum Database的硬件服务器的最低推荐规格。Greenplum数据库系统中的所有主机服务器必须具有相同的硬件和软件配置。Greenplum还为其认证的硬件平台提供了硬件构建指南。建议您与Greenplum系统工程师一起检查预期的环境,以确保为Greenplum数据库配置适当的硬件。
最低CPU | 任何x86_64兼容的CPU |
最小内存 | 每个服务器16 GB RAM |
磁盘空间要求 |
|
网络要求 | 阵列中的10G以太网 存在多个接口时,建议使用NIC绑定 Pivotal Greenplum可以使用IPV4或IPV6协议。 |
存储
唯一支持运行Greenplum数据库的文件系统是XFS文件系统。Pivotal 明确不支持所有其他文件系统。
Greenplum支持网络或共享存储:对运行Greenplum数据库的服务器而言,该共享存储被呈现为块设备,且XFS文件系统被安装在块设备上。Greenplum不 支持网络文件系统。当使用网络或共享存储时,Greenplum数据库镜像必须与使用本地存储的方式相同,且不可以修改segment的镜像方案或恢复方案。
Pivotal Greenplum数据库不直接支持共享存储的其他功能(例如重复数据删除和/或复制),但可以在存储供应商的支持下使用,只要它们不干扰Greenplum Database在该站点上的预期操作(此操作由Pivotal决定)即可。
仅当将存储呈现为块设备且将XFS文件系统安装在此块设备上用来存储segment目录时,Greenplum数据库才能部署到虚拟化系统。
警告:在超融合基础架构(HCI)上运行Greenplum数据库具有性能、可伸缩性和稳定性方面的已知问题,因此不建议将其作为Pivotal Greenplum数据库的可伸缩解决方案,如果出现与基础架构相关的稳定性问题,Pivotal可能不提供支持。HCI虚拟化了传统硬件系统的所有元素,至少包括了虚拟化计算、虚拟化SAN和虚拟化网络。
译者注:6.8版本文档有上述一段警告。6.9版本删除。
Greenplum数据库支持在Amazon Web Services(AWS)服务器上:要么使用Amazon实例存储(Amazon使用卷名ephemeral[0-20]),要么使用Amazon Elastic Block Store(Amazon EBS)存储。如果使用Amazon EBS存储,则该存储应为Amazon EBS卷的RAID,并随XFS文件系统一起安装,以使其成为受支持的配置。
数据域增强(Data Domain Boost)
Pivotal Greenplum 6.0.0支持Data Domain Boost,用于Red Hat Enterprise Linux上的备份。下表列出了Pivotal Greenplum 6.x支持的Data Domain Boost SDK和DDOS版本。
Pivotal Greenplum | Data Domain Boost | DDOS |
---|---|---|
6.x | 3.3 | 6.1(所有版本) 6.0(所有版本) |
注意:除了上表中列出的DDOS版本之外,Pivotal Greenplum还支持认证版本后的所有次要修补版本(第四位数字版本)。
工具和扩展的兼容性
客户端工具
Greenplum Database 6在各种平台上发布了Clients工具包,可用于从客户端系统访问Greenplum Database。以下平台支持Greenplum 6 Clients工具包:
- Red Hat 企业版 Linux x86_64 6.x(RHEL 6)
- Red Hat 企业版 Linux x86_64 7.x(RHEL 7)
- Ubuntu 18.04 LTS
- Windows 10(32位和64位)
- Windows 8(32位和64位)
- Windows Server 2012(32位和64位)
- Windows Server 2012 R2(32位和64位)
- Windows Server 2008 R2(32位和64位)
Greenplum 6 客户端程序包含Greenplum 5包中提供的客户端程序和加载程序,以及数据库/角色/语言命令以及Greenplum-Kafka集成和Greenplum Streaming Server命令工具。有关Greenplum 6 客户端工具的安装和使用详细信息,请参阅Greenplum 客户端和加载器工具包。
扩展
下表列出了与此版本的Greenplum Database 6兼容的Pivotal Greenplum Extensions版本。
组件 | 包版本 | 附加信息 |
---|---|---|
PL / Java | 2.0.2 | 支持Java 8和11。 |
Python数据科学模块软件包 | 2.0.2 | |
PL / R | 3.0.3 | (CentOS)R 3.3.3 (Ubuntu)您安装了R 3.5.1+。 |
R数据科学库包 | 2.0.2 | |
PL /容器 | 2.1.2 | |
适用于R的PL/容器映像 | 2.1.2 | R 3.6.3 |
适用于Python的PL/容器映像 | 2.1.2 | Python 2.7.12 Python 3.7 |
PL/容器Beta | 3.0.0-测试版 | |
适用于R的PL/容器Beta映像 | 3.0.0-测试版 | R 3.4.4 |
GreenplumR | 1.0.0 | 支持R 3.6+。 |
MADlib机器学习 | 1.17、1.16 | 支持矩阵,见MADlib FAQ。 |
PostGIS空间和地理对象 | 2.5.4 + pivotal.2 2.5.4 + pivotal.1 2.1.5+pivotal2-2 |
有关Oracle兼容性功能的信息,请参见Oracle兼容性功能。
- 模糊字符串匹配扩展
- PL/Python扩展
- pgcrypto扩展
数据连接器
- Greenplum平台扩展框架(PXF)v5.12——PXF(已集成到与Greenplum Database 6),提供对Hadoop、对象存储和SQL外部数据存储的访问。有关PXF配置和使用信息,请参阅Greenplum数据库管理员指南中的使用PXF访问外部数据。
- Greenplum-Kafka集成——Pivotal Greenplum-Kafka集成提供了从Kafka群集到Pivotal Greenplum数据库群集的高速并行数据传输,以进行批式和流式的ETL处理。它需要Kafka 0.11版本或更高版本,才能保证一次交付。有关此功能的更多信息,请参阅 Pivotal Greenplum-Kafka集成文档。
- Greenplum Streaming Server v1.3.6——Pivotal Greenplum Streaming Server是一个ETL工具,可提供从Informatica、Kafka和自定义客户端数据源到Pivotal Greenplum数据库集群的高速并行数据传输。有关此功能的更多信息,请参阅 Pivotal Greenplum Streaming Server文档。
- Greenplum Informatica Connector v1.0.5——Pivotal Greenplum Informatica Connector支持从Informatica PowerCenter群集到Pivotal Greenplum数据库群集的高速数据传输,以进行批式和流式的ETL操作。
- Greenplum Spark连接器v1.6.2——Pivotal Greenplum Spark连接器支持使用Spark的Scala API在Greenplum数据库和Apache Spark集群之间进行高速并行数据传输。
- Progress DataDirect JDBC驱动程序v5.1.4.000223——Progress DataDirect JDBC驱动程序与Type 4体系结构兼容,但是提供了将它们定义为Type 5驱动程序的高级功能。
- Progress DataDirect ODBC驱动程序v7.1.6(07.16.0301)——Progress DataDirect ODBC驱动程序使第三方应用程序可以通过一个通用接口连接到Pivotal Greenplum数据库系统。
注意: Pivotal Greenplum 6不支持Cognos Analytics V11的ODBC驱动程序。
Greenplum数据库不支持通过ODBC驱动程序连接到IBM 的Cognos软件。它支持使用适用于Pivotal Greenplum的DataDirect JDBC驱动程序连接到IBM Cognos软件。该驱动程序可从Pivotal Network下载。
GPText
Pivotal Greenplum数据库6与Pivotal Greenplum Text版本3.3.1和更高版本兼容。有关其他兼容性信息,请参见Greenplum Text文档。
Greenplum命令中心
Pivotal Greenplum数据库6.8仅与Pivotal Greenplum Command Center 6.2和更高版本兼容。有关其他兼容性信息,请参阅Greenplum命令中心文档。
Hadoop发行版
Greenplum数据库通过Greenplum平台扩展框架(PXF)提供对HDFS的访问。
PXF可以使用Cloudera、Hortonworks数据平台、MapR和一般的Apache Hadoop发行版。PXF捆绑了它依赖的所有JAR文件,包括以下Hadoop库:
PXF版本 | Hadoop版本 | Hive服务器版本 | HBase服务器版本 |
---|---|---|---|
5.12、5.11.1、5.10.1 | 2.x,3.1 + | 1.x,2.x,3.1 + | 1.3.2 |
5.8.2 | 2.x | 1.x | 1.3.2 |
5.8.1 | 2.x | 1.x | 1.3.2 |
注意:如果您计划访问存储在Cloudera Hadoop集群中的JSON格式数据,则PXF需要使用Cloudera 5.8或更高版本的Hadoop发行版。