云和恩墨 oracle 监控,产品速递 | 云和恩墨Bethune Pro2——数据库实时监控和智能巡检平台...

运维工程师负责企业IT系统的日常维护工作,包括每日的系统巡检,日常的系统健康信息监控。

通过使用 Bethune Pro2,工程师可以通过每日巡检建议,快捷的感知各个数据库中存在的隐患与风险点。同时,结合Bethune Pro2 系统中各维度汇总页面(包括:Dashboard,容量中心,性能中心,安全中心,系统中心等),大致了解各系统的健康程度,判断系统是否异常,对于需要进一步分析的系统,还可以生成更详细的全维度分析报告,给出更加细致的诊断分析及建议。

从 v2.0.0 版本开始,运维工程师还可以从系统中心,进入系统相关的监控大屏,实时查看当前系统的运行状态,以及相关的基于阈值的警告信息。现已支持MySQL。

IT 管理者

IT 管理者需要从宏观层面知晓企业各大 IT 系统的健康状况,并对各个系统的变更进行有效的监督管理。通过使用 Bethune Pro2,IT 管理者可以很快捷的了解到各个数据库的健康状态,健康度评分,系统变更情况以及容量和性能的变化趋势。同时,Bethune Pro2 中提供的容量预测,也可以为企业的采购决策提供一定的参考。

b9a7c186457b6382404e73fa0693b22f.png

Bethune Pro2 产品架构图

从部署的服务器的角度,可以将 Bethune Pro2 分为三层架构:

资料库服务

安装企业版 Oracle 数据库,用于存储 Bethune Pro2 采集和分析数据。

应用服务

安装 Bethune Pro2 主体应用程序及相关服务程序,用于采集与分析任务的调度,并提供对外访问的接口与服务。

Agent 服务

部署在待巡检的数据库服务器中,负责本地采集任务的执行,并与 Bethune Pro2 应用服务进行数据交互。

其中,资料库服务与应用服务原则上可以部署在同一台服务器中,但从安全性角度来说,建议将资料库服务与应用服务分开部署,同时加强资料库服务器的网络安全策略。

核心优势

Bethune Pro2 源于 Bethune (云和恩墨自主研发的公有版智能巡检平台),同时在内容和组织形式上了做了全新的升级,后台数据采用全新的数据组织架构,基于任务时间线的数据采集和增量管理,同时对巡检工作涉及到的各项任务进行了增强和优化。

在 v2.0.0 版本中,添加了巡检功能,提供准实时级的系统关键指标分析,展示与预警。

Bethune Pro 的优势主要表现在以下两个方向上:

自动化

一次巡检的生命周期,包括:数据采集,数据打包传输,结果分析汇总,图形化展示,建议的产生。Bethune Pro2 能自发处理所有这些巡检周期中的各项任务,完全不需要人工参与。同时,会在一天工作的开始,将当天的巡检建议主动推送给用户(包括系统站内消息,邮件,短信等多渠道通知系统),极大的降低巡检任务的工作量。

在监控体系中,通过 JDBC 直连数据库,实时采集各个目标节点中的运行指标信息,基于用户自定义的阈值进行预警通知。

984d4e8a6bcdbaace0cddd8f923fdda2.png

容量智能预测

智能化

在数据分析阶段,Bethune Pro2 积极采用智能化的机器学习算法与策略。通过多方面相关数据的关联分析,同时结合机器学习算法的思路,产生有实际意义的建设性建议。

Bethune Pro2 主要包含但不限于如下特色功能:

1 容量智能预测

Bethune Pro2 目前的预测功能主要用于表空间剩余预测

每日凌晨启动空间预测分析程序,针对最新采集的各个系统表空间的使用率,采用机器学习算法,根据表空间历史剩余空间变化情况,拟合未来一段时间内的剩余空间变化趋势,判断在不继续添加数据文件的情况下,当前剩余空间降低到零的时间,从而得到当前剩余空间预计可以支撑使用的天数。

同时,在容量中心页面的空间预测部分,也能同步追踪到各个表空间剩余可用空间的历史变化趋势。

2 异常增长自动分析

Bethune Pro2 目前的异常分析功能主要用于空间异常预测,包括:数据库增长,表空间增长,段空间增长,每小时的 Redo 日志量等。

每日凌晨启动空间增长分析程序,针对最新采集的各个系统空间使用数据,采用机器学习算法,结合历史一段时间内的空间使用增量趋势,计算昨日各个维度空间增长量的合理范围,进而判断昨日实际增长量是否合理,对于增长量不合理的对象类型(数据库,表空间,段,Redo 量等),给出具体的数据提示,并通过每日建议的方式提醒用户。

dc88f5de5f67e10ae7fc5c21e593fc47.png

异常增长自动分析

3 系统变更跟踪

Bethune Pro2 支持预设的 16 种不同类型的系统变更的持续追踪。

c8ada417f7692bf23575e8930b957e79.png

在页面中,Bethune Pro2 创新性的使用了时间轴的方式,将每天的系统变更汇总,串联成一条时间轴线,通过滑动遍历时间轴,可以快速的看出每天的系统变更数量。

3c81236cd73f159c550a36f0054c4d58.png

同时,在每天的变更数汇总标签中,还可以点击检查当天的详细各类变更列表,便于更细一步的追踪系统中的各项变更。

4 DBLink 互联图谱

Oracle 数据库中,通过 DB Link 可以直接查询其他数据库中的数据,这为多系统之间的数据交换与协作提供了极大的便利。但这种跨数据库的查询也带来了额外的问题,那就是为了保证查询数据的一致性而导致的 SCN 的跳跃式增长,这种 SCN 跳跃式增长若频繁发生,会导致 SCN 增长量超过 Oracle 每日累积增长的上限,导致系统宕机,并且无法正常启动。

Oracle 提供了修复补丁,用于修复这类 SCN 问题,但需要梳理企业环境中所有数据库的 DB Link 互联关系,传统的方式需要在各个数据库环境中分别梳理各自的 DB Link,并将其汇总起来,得到整个企业环境中的 DB Link 互联关系图谱。

c18329c392df25f58fd1e5d347e04ff3.png

5 IP与系统关系图谱

企业环境中,每套数据库系统,其可连接的客户端应当是有限且可控的,当出现异常连接的 IP 时,需要时刻保持警惕,防止未知 IP 源的数据窃取与攻击。

Bethune Pro2 中通过每小时的监听日志增量采集,同时在每日凌晨启动系统分析程序,获取并更新各个系统与 IP 的关系图谱,以及各个 IP 发起的数据库链接请求数。

在安全中心页面,通过搜索指定的 IP,可获得 IP 对应的系统列表,或者搜索系统名称,可获得系统对应的 IP 列表。

7a3af8511d41623e1de518bd41000240.png

6 实时监控大屏

在实时监控大屏中,集中展示了系统中部分关键指标的实时监控数据,部分监控数据具有阈值告警功能,可以在配置页面中,对这些阈值进行定制调整,以满足不同系统的定制化监控需求。

监控大屏中各个图表都可以动态变化大小,以满足不同客户不同偏重点的展示需求。

9d1a791160510c0b1e1d701f8ba0b17b.png

目前监控大屏主要包括如下内容:

·风险雷达图

通过一定的评分模型,将系统风险点,在不同维度进行积分,得到各个维度的风险指数,分值越大,风险越大。

·系统拓扑图

通过图形的方式展示系统中各个组件的运行状态,其间的数据交互流向,以及网络流量和延迟信息。

当系统中有节点异常的时候,通过图标的状态变化,能非常直观的看出系统内各个节点的运行情况。

·CPU 使用率

展示系统中各个主机的 CPU 使用率的变化趋势。

RAC 环境中多个实例在同一图表中展示,便于对比系统中各个节点的实时负载变化情况。

·空间使用类

囊括了 top 表空间使用情况,归档空间使用情况,以及主机内存的使用情况。

·活动会话

展示系统中各个节点实例中,活动会话的变化情况。

·IO 效率

展示系统中关键的几个 IO 类等待事件的平均等待时间。

·最近告警

通过滚动的方式,循环展示系统中最近的一些警告信息。

对于已知晓或者处理过的告警,可以手动删除。

7 MySQL监控大屏

Bethune  Pro 为 MySQL 数据库设计了全新的监控大屏。针对 MySQL 实例较多的情况,设计了自定义监控大屏展示功能。一个监控大屏可以指定展示一个或多个 MySQL 分组。同时,为 MYSQL 数据库设计了默认的监控模板,用户也可以调整每个监控项的配置规则,阈值等组成一个新的模板。

cc95259f6a6a7b26e06cd24fa486b6bd.png

部署说明

Bethune Pro2 智能巡检平台的部署主要包括三大部分

Bethune Pro2 资料库

Bethune Pro2 应用服务器

目标系统 Agent 客户端

各个部分的部署要求如下表所示:

d55e95dfae56ec8d49c37e24d31a1160.png

注意:以上列表中的资料库和应用服务器可以部署在同一台服务器,但相应的配置需要同步叠加提高。

网络连通要求:

应用服务器需要能在Oracle 监听端口上连接资料库和目标服务器(默认1521)

应用服务器与目标服务器上需要安装有 telnet 或者ssh 客户端

应用服务器与目标服务器需要在 Agent 固定端口上互通(默认8008)

应用服务器上需要开通 9090、9093、8500、8009端口

用户环境中需要能在8080端口上与应用服务器互通,用户登录 Bethune Pro 环境

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值