背景与原因:最近两次线上故障,是因为数据风控部门拉取交易数据库数据时,大批量查询导致正常的业务访问数据库异常,链路监控上暴出各种超时。
解决方案:
1、 针对只读账号拉取数据情况,只提供独立的只读库的地址,取消读写库jdbc访问。注意是独立的只读库,若是做了读写分离的访问方式,正常的业务读也会流转到只读库。在这种情况下,拖垮只读库同样导致的是线上问题。
2、取消开账户,仅仅提供从hive中获取数据;对于数据实时性要求比较高的情况,建议以binlog方式canal获取数据。
严格把控,不然出问题就是你的锅!