Greenplum平台扩展框架(PXF)通过将外部数据源映射成GP的外部表,使得Greenplum能够并行、高吞吐量以及联合查询外部数据源的数据。该扩展插件是基于Apache HAWQ的PXF(孵化)。
该文档主要分为以下模块对pxf进行详细介绍和使用:
- PXF架构
本主题描述了PXF的体系结构及其与Greenplum Database的集成。 - 安装和配置PXF
本主题详细介绍了PXF和支持客户端的安装,配置和启动过程。 - 升级PXF
本主题介绍在安装新版本的Greenplum数据库时必须执行的升级PXF的过程。 - 使用PXF读写外部数据
本主题描述了重要的PXF过程和概念,包括启用PXF以在数据库和PXF协议以及外部表定义中使用。 - 从HDFS读取数据
本主题介绍如何使用PXF HDFS连接器和相关配置文件来读取Text和Avro格式的HDFS文件。 - 将数据写入HDFS
本主题介绍如何使用PXF HDFS连接器和相关配置文件将Text和SequenceFile格式的二进制数据写入HDFS文件。 - 访问Hive表数据
本主题介绍如何使用PXF Hive连接器和相关配置文件读取以TextFile,RCFile,Parquet和ORC存储格式存储的Hive表。 - 访问HBase表数据
本主题介绍如何使用PXF HBase连接器读取HBase表数据。 - PXF故障排除
本主题详细介绍了PXF的服务和数据库级日志记录配置过程。它还标识了一些常见的PXF错误,并描述了如何解决PXF内存问题。 - 使用PXF Java SDK
PXF SDK提供扩展Greenplum数据源扩展接口、数据存储格式扩展接口、数据访问接口。本主题介绍如何设置PXF开发环境,使用PXF API以及部署扩展。