oracle 数据导入odps,SQL_ODPS-MaxCompute-odpscmd-tunnel-数据上传下载

1. rd行分割 -fd列分割 -charset编码

--建临时表

odps@ work_test_1>create table if not exists t_rd_fd(id int,name string);

--源数据data_t_rd_fd.txt

--666$$张三||555$$李四||

-- -rd行分割 -fd列分割 -charset编码

odps@ work_test_1>tunnel upload D:\#ODPS_D2\odps_data\data_t_rd_fd.txt work_test_1.t_rd_fd -rd "||" -fd "$$" -charset gbk;

Upload session: 20200220231800a0dbdb0b12e98660

Start upload:D:\#ODPS_D2\odps_data\data_t_rd_fd.txt

Using || to split records

Upload in strict schema mode: true

Total bytes:26 Split input to 1 blocks

0000-00-00 00:00:00 scan block: '1'

0000-00-00 00:00:00 scan block complete, block id: 1

0000-00-00 00:00:00 upload block: '1'

0000-00-00 00:00:00 upload block complete, block id: 1

OK

--检查一下

odps@ work_test_1>select * from work_test_1.t_rd_fd;

+------------+------------+

| id | name |

+------------+------------+

| 666 | 瀵姳绗? |

| 555 | 閺夊骸娲? |

+------------+------------+

2.脏数据-dbr true -s only ;tunnel show bad 0000;

--源数据data_t_rd_fd.txt

--666,张三

--555,李四

--1.34,王五

--AA

-- -dbr true -s only;审查一下有哪些脏数据 仅读

odps@ work_test_1>tunnel upload D:\#ODPS_D2\odps_data\data_t_rd_fd.txt work_test_1.t_rd_fd -dbr true -s only;

Upload session: 000000000009151647df0b12dd8e9e --注意这个session

Start upload:D:\#ODPS_D2\odps_data\data_t_rd_fd.txt

Using \r\n to split records

Upload in strict schema mode: true

Total bytes:39 Split input to 1 blocks

0000-00-00 00:00:00 scan block: '1'

0000-00-00 00:00:00 ERROR: format error - :1, BIGINT:'1.34' For input string: "1.34"content: 1.34,鐜嬩簲

offset: 29

0000-00-00 00:00:00 ERROR: column mismatch, expected 2 columns, 1 columns found, please check data or delimiter

content: AA

offset: 34

0000-00-00 00:00:00 scan block complete, block id: 1 [bad 2]

OK

odps@ work_test_1>

--tunnel show bad 具体session;查看一下具体是哪些脏数据

--通过这种方法可以快速找到错误信息对源文件修正

odps@ work_test_1>tunnel show bad 0000000000329151647df0b12dd8e9e;

1.34,鐜嬩簲

AA

odps@ work_test_1>

--然后可以去源文件修正或删除,再上传

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
阿里云大数据计算服务MaxCompute(原ODPS)是一种云端大数据处理和分析服务,它提供了一个高效、安全和稳定的SQL引擎,用于处理和分析大规模数据MaxCompute的SQL使用指南如下: 1. 创建表:使用CREATE TABLE语句创建表,指定表的名称、列名和数据类型。 2. 插入数据:使用INSERT INTO语句将数据插入到表中,可以一次插入多行数据。 3. 查询数据:使用SELECT语句从表中查询数据,可以使用条件语句、排序和聚合函数进行筛选和处理。 4. 更新数据:使用UPDATE语句更新表中的数据,可以根据条件对指定的行进行更新。 5. 删除数据:使用DELETE语句删除表中的数据,可以根据条件删除指定的行。 6. 表连接:使用JOIN语句将多个表连接在一起,根据指定的关联条件进行数据的查询和分析。 7. 数据转换:通过使用转换函数,将数据在不同的数据类型之间进行转换,如字符串转换为日期、数字转换为字符串等。 8. 数据分组:使用GROUP BY语句将数据按照指定的列进行分组,然后对每个分组进行聚合操作,如计算平均值、求和等。 9. 数据排序:通过使用ORDER BY语句对查询结果按照指定的列进行排序,可以按照升序或降序排列。 10. 数据统计:使用聚合函数,如COUNT、SUM、AVG等对查询结果进行统计分析,可以获取总数、求和、平均值等数据。 11. 数据分区:使用PARTITION BY子句将表数据划分成多个分区,可以加快查询和分析的速度。 总之,MaxCompute提供了强大的SQL功能,可以方便地对大规模数据进行处理、分析和洞察,帮助用户更好地进行数据驱动的决策和业务创新。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值