hive同步到pg

将hive库的数据同步到PostgreSQL库中

#!/bin/bash
# 参数校验
if [ $# -lt 1 ] ; then
  echo "期待1个参数"
  exit 1
fi

#时间处理
dt="$(date -d "$1 1 day ago" +'%Y-%m-%d')"

# pg库的配置连接信息
rdb="postgresql"
host="**********************"
port="**********************"
user="**********************"
password="******************"
database="******************"

export LANG="en_US.UTF-8"
export PGPASSWORD=${password}

hive_table="****************"
hive_partition="dt='${dt}'"
pg_table="******************"

#路径
current_path="$(cd $(dirname $0);pwd)"
tmp_file="$current_path/data"

hive_sql="
  select 
    name,
    sex,
    age
  from 
    ${hive_table}
  where dt='${dt}';
"
sudo -u root /home/apache-hive-2.1.1-bin/bin/hive -e "  ${hive_sql} " > $tmp_file || exit 1

pg_sql="
  begin;                                                 -- 回滚用
  truncate table ${pg_table};                            -- 清空表数据
  alter sequence ${pg_table}_id_seq restart with 1;      -- 表的自增id 置为1 
  copy ${pg_table}(name,sex,age) from stdin;             -- 将数据导入到pg中
  commit;                                                -- 回滚用 中间任意一步出错就回滚
"
# id_seq 一般会在前面加上table名  ${pg_table}_id_seq
# 如果 alter sequence ${pg_table}_id_seq restart with 1; 报以下错:
# ERROR: must be owner of sequence ${pg_table}_id_seq
# 就将其改成  select setval('${pg_table}_id_seq'::regclass,1);
# setval不需要owner权限

cat $tmp_file | psql -h${host} -p${port} -d${database} -U${user}  -c " ${pg_sql} " || exit 1
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TriumPhSK

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值