CSV&TEXT格式数据文件如何通过外部表的方式导入HashData在青云上面的应用

CSV&TEXT格式数据文件如何通过外部表的方式导入HashData在青云上面的应用

优势:

  • 操作简单,不需要额外的ETL工具
  • 导入是多实例并发执行,效率大概在每个 instance 10-15MB/s

如何通过外部表将 csv & text 格式数据文件,导入到hashdata数据仓库,简约步骤如下:

  • 1 - 创建与hashdata集群在同一区域的对象存储。
  • 2 - 创建API秘钥对。
  • 3 - 将csv或text文件上传到对象存储。
  • 4 - 为每一张表创建外部表。
  • 5 - 通过 insert into <table_name> select * from <external_table_name> 的方式将数据导入hashdata数据仓库。

首先我们创建一个测试的数据文件 testdata.txt,内容如下:

1|a
2|b

下面就是我们需要进行的操作

通过 pg_dump 将数据库对象(表结构等)导入HashData数据库集群。


 1. ---创建测试表
drop table test cascade;
create table test (id int,col1 text)distributed randomly;
 2. ---创建测试外部表,此处的秘钥对需要替换为你自己的秘钥对
drop EXTERNAL TABLE e_test;
CREATE READABLE EXTERNAL TABLE e_test (LIKE test) 
LOCATION ('oss://zz-a111.pek3b.qingstor.com/testdata.txt oss_type=qs access_key_id=xxx secret_access_key=xxx') 
FORMAT 'text' (DELIMITER '|');
 3. ---检查一下外部表数据格式是否有冲突
select * from e_test;
 4. ---将数据文件中的数据通过外部表的方式导入HashData数据仓库
insert into test select * from e_test;
 5. ---检查导入的数据是否完整,准确
select * from test;

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值