ETL工作中的小技巧总结

ETL工作中的小技巧总结

  1. beeline 直接连接hive
    beeline -u jdbc:hive2://node01:10000/cpdl_raw -n root -p 123456
  2. yarn
    查看yarn任务:yarn application -list
    关闭yarn任务:yarn application -kill 任务号
  3. 在shell中连接oracle
    sqlplus -L 用户/密码@IP:1521/库 <<EOF
    修改,查询,删除
    set serveroutput on
    set linesize 120
    set pagesize 0
    set TAB off
    set FEEDBACK off
    set HEADING off
    set TRIMOUT off
    set Verify off
    DELETE FROM test WHERE name=‘test’;
    insert into test values(‘xiaoming’,15);
    COMMIT;
    QUIT
    EOF
    查询
    YS_ABBR=sqlplus -S '用户/密码'@IP:1521/库 << ! set heading off set feedback off set pagesize 0 set verify off set echo off select * from test; exit !
  4. 集群之间数据传输
    hadoop distcp -overwite -m 200 hdfs://node01:8020/tmp/test /tmp/test
    distcp跳过检查
    第一种方法:
    -update -skipcrccheck
    第二种方法:加-D参数
    hadoop distcp -Ddfs.checksum.type=CRC32 -update src dst
  5. mapjoin
    mapjoin: /+mapjoin()/
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值