将数据从HDFS上导入到Greenplum

    CREATE READABLE EXTERNAL TABLE weblogs(  
    md5 text,  
    url text,  
    request_date date,  
    request_time time,  
    ip inet  
    )  
    LOCATION ('gphdfs://<NAMENODE_HOST>:<NAMENODE_PORT>/data/weblogs/  
    weblog_ entries.txt')  
    FORMAT 'TEXT' (DELIMITER '\t')
    SEGMENT REJECT LIMIT 9999;

外部表创建完成;


create table hdfs01(
id text,  
str text
)
DISTRIBUTED  RANDOMLY;
创建Greenplum表


装载数据:

insert into hdfs01 select * from ext01;


之前要根据这个页面描述的修改两个参数:

http://gpdb.docs.pivotal.io/4390/admin_guide/load/topics/g-one-time-hdfs-protocol-installation.html

gpconfig -c gp_hadoop_target_version -v "'gphd-2.0'"
gpconfig -c gp_hadoop_home -v "'/usr/lib/gphd'"
gpstop -u


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值