hbase导入csv文件_CDH5.4.5运行Phoenix导入CSV文件

本文介绍了如何在CDH5.4.5环境下安装Phoenix并利用它将CSV文件导入到HBase中。首先,通过添加远程Parcel Repository URL下载并激活Phoenix。接着,展示了如何使用Phoenix的命令行工具`psql.py`导入CSV文件,并定义了表结构。最后,通过Hadoop的MapReduce方式尝试导入大量CSV文件,但遇到了权限和输入路径的问题,提示需要将文件放在HDFS上。
摘要由CSDN通过智能技术生成

标签:

1.安装phoenix

在界面上设置Phoenix的parcel包:

http://52.11.56.155:7180/cmf/settings?groupKey=config.scm.parcel.display_group&groupParent=

添加一个Remote Parcel Repository URLs url:http://archive.cloudera.com/cloudera-labs/phoenix/parcels/1.0/

CM会自动发现新的parcel,然后点击Download,Distribute and Active。重启集群

2.进入到某台服务器上,查看phoenix的安装路径

[root@ip-172-31-25-243 ~]# cd /opt/cloudera/parcels/CLABS_PHOENIX

[root@ip-172-31-25-243 phoenix]# lsbin dev examples lib phoenix-4.3.0-clabs-phoenix-1.0.0-client.jar phoenix-4.3.0-clabs-phoenix-1.0.0-server.jar phoenix-4.3.0-clabs-phoenix-1.0.0-server-without-antlr.jar

bin目录下为可执行文件,examples目录下为一些样例

3.导入CSV格式的表

CSV文件为/root/ceb/cis_cust_imp_info.csv,内容如下:

20131131,100010001001,BR01,2000.01

20131131,100010001002,BR01,2000.02

20131131,100010001003,BR02,2000.03

定义一个表结构的文件/root/ceb/cis_cust_imp_info.sql,内容如下,

CREATE TABLE IF NOT EXISTScis_cust_imp_info(

statistics_dtvarchar(50),

cust_idvarchar(50),

open_org_idvarchar(50),

assert9_baldecimal(18,2),CONSTRAINT pk PRIMARY KEY(statistics_dt, cust_id)

);

注意最后的分号是必须的。

运行命令,导入CSV

[root@ip-172-31-25-243 phoenix]# bin/psql.py 172.31.25.244 /root/ceb/cis_cust_imp_info.sql /root/ceb/cis_cust_imp_info.csv

SLF4J: Failed to load class"org.slf4j.impl.StaticLoggerBinder".

SLF4J: Defaulting to no-operation (NOP) logger implementation

SLF4J: See http://www.slf4j.org/cod

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值