hbase删除某一条数据_脚本批量删除hbase数据

    由于从kafka消费过来写入hbase的数据量有点大,导致关联的外部hive表使用性能有点差,因此决定把已经导入hive的dwd层后的数据进行删除,删除脚本如下:

del_date=$1

filename=$(pwd)/rowkey.csv

beeline  --incremental=true --showHeader=false --outputformat=dsv --delimiterForDSV=$'\t'  -e "select  concat('deleteall \'default:monitorData\',\'',row_key,'\'')   from  dw_ods.ods_api_msp_plan_point where row_key like '%${del_date}'">${filename}

sed -i '$d' ${filename}

hbase shell ${filename} > del.log

    脚本可能不是很好看,这里截图展示一下:

eb6d52899bd69a2b2769e2112cc7bd92.png

    以上脚本删除的逻辑是首先通过外部关联表查询出需要删除的rowkey,由于这个表的rowkey后缀是日期,因此通过模糊日期查询出需要删除的rowkey写入一个文件,由于写入文件后最后一行是无关的信息,因此这里需要用sed命令进行删除。

79ba3df3493780ee65c5dcddf91b84fd.png

    脚本编辑好后,写入del_hbase.sh文件,最后执行sh del_hbase.sh yyyyMMdd进行删除指定日期的数据。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值