Flink批量写入HBase效率问题
标题 HBase批量写入单次提交数据量大小问题
生产环境写入HBase体验:
如果写入HBase效率瓶颈在连接HBase费时上,keyBy(字段).countWindow(50000).apply(new …)比任何复杂的自定义时间窗口效率都高,太有感触了T T。
DataStream<List<Put>> sourceList = dataStream.timeWindowAll(Time.seconds(2)).apply(new OrderToHBaseFunctionOutPutFormat()).name("format");
sourceList.writeUsingOutputFormat(new BulkPutHBaseOutputFormat<Put>() {
@Override
public String getTableName() {
return "ORDER_DOC_SN_TEST";
}
@Override
public String getColumnFamily() {
return "CFD";
}
@Override
public List<Put> writeList(List<Put> list) {
return list;
}
}).name("write");
如果消费的数据量比较大的时候,写入HBase可能会出现阻塞,如&#x