使用TableMapReduceUtil犯了个错误,求大家指教:
背景: 使用TableMapReduceUtil统计hbase表的数据条数;
使用TableMapReduceUtil情况下,会由于表有多少个region就会启动多少个map,然后每个map的对应一个scan,每个scan对象会连接一次zk,这样就会导致对于region比较多的hbase表,zk被大量连接导致zk查询失败。
如果有什么好的方案,欢迎大家指教,谢谢!
ps: hive和hbase shell统计这些方法已经知道了,主要想了解通过上述方法能不能实现,同时不会造成zk的大量连接。