hive jdbc 访问配置_DBCP参数在Hive JDBC上的实践

最新推荐文章于 2024-08-05 20:59:55 发布

weixin_39541189

最新推荐文章于 2024-08-05 20:59:55 发布

阅读量626

点赞数

文章标签： hive jdbc 访问配置

本文链接：https://blog.csdn.net/weixin_39541189/article/details/111749597

版权

查询程序一开始只是简单使用dbcp来做连接的限制。在实践的过程中遇到各种问题，本文记录DBCP的参数优化提高程序健壮性的两次过程。

最开始的DBCP的配置：

第一个遇到的问题，就是每次hiveserver2重启后，这个查询程序也得重启。在实际使用过程中非常的麻烦！！

重启问题(连接断开后不能重连)

添加三个参数：

testOnBorrow = “true” 借出连接时不要测试，否则很影响性能。如果需要可以把validation语句搞个性能消耗最少的

testWhileIdle = “true” 指明连接是否被空闲连接回收器(如果有)进行检验.如果检测失败,则连接将被从池中去除.

validationQuery = “show databases” 验证连接是否可用，使用的SQL语句

解释：

testWhileIdle = “true” 表示每 {timeBetweenEvictionRunsMillis} (默认-1，不执行)秒，取出 {numTestsPerEvictionRun} (默认值3)条连接，使用 {validationQuery} 进行测试，测试不成功就销毁连接。销毁连接后，连接数量就少了，如果小于minIdle数量，就新建连接。

testOnBorrow = “true” 它的默认值是true，如果测试失败会drop掉然后再borrow。false表示每次从连接池中取出连接时，不需要执行 {validationQuery} 中的SQL进行测试。若配置为true,对性能有非常大的影响，性能会下降7-10倍。所在一定要配置为false.

调整参数后hiveserver2重启，查询再连会先报错然后再连。在每次取连接的时刻使用 show databases 测试，如果失败则从pool中删掉这个连接，重新再取，实现了重连的效果。这里不用 select 1 hive里面执行很慢，同时testWhileIdle并没有生效，因为没有配置timeBetweenEvictionRunsMillis参数。

调整后的：

问题又来了，由于测试切换tez和spark才配置了上面的重连。但是切换到spark后，启动的spark会一直保持(连接创建的session不会主动关闭)，直到hiveserver2 session超时(默认6h检查一次，7h idle就关闭)。

注意：有个隐忧，hive-on-spark每个连接都创建一个SESSION，这就退化到MR操作了。不能完全利用SPARK的优势！！例如业务中，即查询count、又获取一页数据，这里就是两个单独的spark程序！！N个session就N个 hive on spark 啊！！

第二个问题，服务端session强制关闭

问题其实和参考中的: MySQL8小时问题，Mysql服务器默认连接的“wait_timeout”是8小时，也就是说一个connection空闲超过8个小时，Mysql将自动断开该 connection 一模一样的。在增加 minEvictableIdleTimeMillis 和 timeBetweenEvictionRunsMillis 设置检查和回收的时间。

timeBetweenEvictionRunsMillis = “1800000” 每30分钟运行一次空闲连接回收器，没必要那么频繁。

minEvictableIdleTimeMillis = “3600000” 池中的连接空闲1个小时后被回收，如果1个半小时没有操作，这个session就会被客户端关闭。可以通过yarn-8088的scheduler页面查看。

设置后的最终效果：

很多程序都有很多参数，大部分能通过文档明白，但是一些参数不到实践真的很难真正体会它的含义。参考的文章两次改进我查看了，但是第一次看的时刻根本没去加其他参数，因为对我来说没用，解决当前问题用不到嘛。

hadoop的参数更多，core/hdfs/mapred/yarn需要多用才能发现参数的功能和妙用。纸上得来终觉浅，绝知此事要躬行。

–END

weixin_39541189

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

hive jdbc 访问 配置_DBCP参数在Hive JDBC上的实践

hive jdbc 访问配置_DBCP参数在Hive JDBC上的实践