如何在Greenplum中并行运行R程序——Greenplum R library介绍

Greenplum R库提供gpapply和gptapply函数,允许在Greenplum数据库中并行执行R语言程序,避免数据移动,提高效率。该库将R代码转换为UDF,利用Greenplum的并行计算能力,同时支持通过PL/R和PL/Container两种方式执行R UDF,兼顾效率和安全性。
摘要由CSDN通过智能技术生成

了解更多Greenplum技术干货,欢迎访问Greenplum中文社区网站

引言

本文将介绍一个全新的基于Greenplum的R语言开发函数库Greenplum R。Greenplum R提供了gpapply和gptapply两个函数,可以把R语言的程序发送至Greenplum端并行执行,从而避免数据的移动和提高R语言的执行效率。

R语言是一个开源的专注于统计分析的程序设计语言,具有丰富的统计分析扩展,在大数据浪潮中,R语言也被数据分析师广泛的应用于大数据分析中。各大数据平台也加强了对R语言的支持。

Greenplum大数据分析平台对R语言有良好的支持。在Greenplum中可以使用两种方式使用R语言进行数据分析,一种是使用ODBC连接到Greenplum数据库读取数据,另一种是编写PL/R的用户定义函数(User Defined Function, UDF)。这两种方式各自有优缺点,第一种方式不需要学习PL/R的特殊的语法,仅仅需要编写标准的R语言程序,但是缺点也是很明显的,需要把数据从Greenplum读取到客户端进行计算,这样的话既需要做数据移动又无法发挥Greenplum并行计算的优势;第二种方式不需要移动数据,而且可以使R程序并行执行,但是用户需要学习PL/R的语法,并且使用PL/R编写的用户定义函数(UDF)不易于调试。

那么有没有一个两全其美的方法呢?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值