【实战】Greenplum平台扩展框架PXF与Hadoop的数据交互

本文转自掌数科技 ...
摘要由CSDN通过智能技术生成

a50ef6d1-5439-45e1-9762-7a25b11a2091.jpg

了解更多Greenplum相关内容,欢迎访问Greenplum中文社区网站

本文转自掌数科技

 

一、与HADOOP HDFS的交互

 

01 PXF是什么

 

PXF是 Greenplum平台扩展框架(PXF),通过内置连接器提供对外部数据的访问。
PXF作为Greenplum与hadoop集群数据交互的并行通道框架,在标准功能外,还支持自定义开发与扩展,在Greenplum中通过PXF可以并行加载及并行卸载Hadoop平台数据。
如下图所示:

4208c798-057e-44db-9d3f-275ac15403b2.jpg

 

通过PXF,可以把Greenplum超强的结构化数据超强的存储和计算能力(一般不大于50PB的数据量)与Hadoop的海量半结构化、非结构化数据存储存储和分析能力结合起来,为企业数字化转型战略提供扎实的数据架构基础,其中Greenplum作为企业核心数据仓库(部分企业也通过Greenplum存储和处理半结构化及非结构化数据,如用户访问日志,文档等),Hadoop主要作为海量半结构化数据和非结构化数据的存储及处理平台,以及结构化历史流水数据的检索(Hbase)。

 

PXF可支持访问的外部数据源有HDFS,Hive和Hbase,我们接下来将分三篇文章描述PXF如何与这三种数据源进行交互。

 

下面我们将围绕Greenplum与Hadoop hdfs文件系统的数据交互进行,在Greenplum数据库中通过PXF协议读取hdfs中数据和向hdfs文件系统写入计算查询结果数据。

 

02 Greenplum PXF实战

 

1. Greenplum读取Hadoop hdfs文件

步骤1:编写文本文件,并增加数据

56a296c6-5e26-4cea-a252-fd0deab08bcb.jpg

 

步骤2:查看数据

592fef69-0124-4995-925a-525b584bb4e6.jpg

 

步骤3:在greenplum中创建外部表

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值