1. 连接adsmeta 执行 (看昨天20点自动处理实时数据的时候,统计的结果)
select table_schema,table_name, task_state,create_time, update_time,data_version, properties from build_current_task where task_type='pangu' order by length(properties) desc limit 10;
注意task_state、data_version和properties三个字段,若有以下异常,请联系ads运维同学确认:
1)如果data_version 是今天或昨天的日期表示正常,如果是前天或更早的日期,表示不正常;
2)如果有incrementalSize比平时大,比如超过5’000‘000‘000(这个表示单分区5G数据),数据量过大可能导致系统不稳定;
3)task_state一列,如果有Failed状态,需要确认。
2. 对每个重要DB,
2.1 随机登陆一个computenode上,cd 到日志目录,执行 grep jvm engine.log。如果有大量少于15000的jvmFree值,表示内存不足。需要联系ads 研发
(可以查看当前有多少实时数据量没有merge)2.2 随机登陆一个computenode上,执行find /home/admin -name "922*" | xargs du -sh | egrep “[0-9]G”。如果有超过1GB以上的路径,建议执行optimize 对应的表,并确认该表写入量是否正常。
select table_schema,table_name, task_state,create_time, update_time,data_version, properties from build_current_task where task_type='pangu' order by length(properties) desc limit 10;
注意task_state、data_version和properties三个字段,若有以下异常,请联系ads运维同学确认:
1)如果data_version 是今天或昨天的日期表示正常,如果是前天或更早的日期,表示不正常;
2)如果有incrementalSize比平时大,比如超过5’000‘000‘000(这个表示单分区5G数据),数据量过大可能导致系统不稳定;
3)task_state一列,如果有Failed状态,需要确认。
2. 对每个重要DB,
2.1 随机登陆一个computenode上,cd 到日志目录,执行 grep jvm engine.log。如果有大量少于15000的jvmFree值,表示内存不足。需要联系ads 研发
(可以查看当前有多少实时数据量没有merge)2.2 随机登陆一个computenode上,执行find /home/admin -name "922*" | xargs du -sh | egrep “[0-9]G”。如果有超过1GB以上的路径,建议执行optimize 对应的表,并确认该表写入量是否正常。