Flink1.8进阶:Flink1.8批量Sink到HBase

该博客探讨了在Flink1.8中提高从Kafka消费数据并批量写入HBase的效率问题。通过使用自定义的时间窗口countWindowAll,实现了每100条数据才进行一次HBase的批量插入,以提升整体性能。文章主要关注核心代码,展示了如何自定义RichSinkFunction,并详细解释了open(), invoke()和close()这三个关键方法的实现。" 113605583,9290553,使用cookie和session进行反反爬实践,"['爬虫技术', '网络协议', '数据提取', '网站登录', '安全爬取']
摘要由CSDN通过智能技术生成

实现背景:   

 消费Kafka数据写入HBase时,单条处理效率太低。需要批量插入hbase,这里自定义时间窗口countWindowAll 实现100条hbase插入一次Hbase

前面我就不写了 直接上核心代码

/*每10秒一个处理窗口*/
DataStream<List<Put>> putList = filterData.countWindowAll(Constants.windowCount).apply(new AllWindowFunction<String, List<Put>, GlobalWindow>() {
    @Override
    public void apply(GlobalWindow window, Iterable<String> message, Collector<List<Put>> out) throws Exception {
        List<Put> putList=new ArrayList<Put>();
        for (String value : message)
        {
            String rowKey=value.replace("::","_");
            Put put = new Put(Bytes.toBytes(rowKey.toString()));
            String[] column=value.split("::
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

卡搜偶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值