原标题:有哪些关键性运行指标需要每日点检、监控、跟踪的?
以下内容来自社区问答
哪些关键性运行指标需要每日点检、监控、跟踪的?关键性指标即可,说多了记不住,用处不大。
洪烨 哈尔滨银行 数据库管理员:,
1.容量信息: 表空间及日志的使用率、状态等
2.性能信息:内存占用情况、慢SQL、消耗CPU的进程、IO消耗大的SQL以及数据库整体IO情况、锁及排序的情况、数据库连接池的情况
3.报错日志、状态异常的表、索引等对象、状态异常的应用程序
杨建旭杨建旭 中国人民银行清算总中心 技术经理:
1)最重要的是 从用户角度的响应时间。比如OLTP事务的平均响应时间。OLAP的批处理时间等。
响应时间是最简单、最直观,也是最重要的指标。如果监控工具、人手、实力都不足的情况下,只看响应时间和告警。
2)数据库都有自己的报警机制,一般运维人员 对数据库机制也不是特别了解,那么报警大家都能看懂。报警中,已经包含了各种warning、error了。运维人员能把这些处理掉,数据库就基本正常了。但你的统一监控工具(比如zabbix)怎么抓到这些告警,需要额外开发。
3)如果对数据库熟一些,那可以关注top5 top10事件。
4)如果说具体指标
资源层面 无非是cpu利用率、内存(各个缓存的命中率)、磁盘(容量够不够,表空间够不够),sql执行时间等。
赵海 大连农商银行 系统架构师:
ORACLE RAC
1. 表空间使用比率
2. ASM使用比率(不要爆了磁盘组)
3. TOP SQL(注意烂SQL)
4. 监听日志大小(定期清理)
5. 注意DG状态是否正常(有DG的情况下)
6. 注意应用用户,尤其中间件连接用户,密码不要设置过期天数。(保持unlimit)
7. 磁盘链路全部Active,不要造成个别链路不稳定导致的IO问题。
8. 注意归档日志状态,不要存在个别切换有问题的日志文件。
...
等等。
建议做成脚本,每天把日志拉出来看看,做到心中有数。返回搜狐,查看更多
责任编辑: