1 管理平台部署
1.1 DMHS 安装
./dmhs_V4.2.94_dm8_rev113762_rh6_64_veri_20220825_sp5.bin -i |
安装类型选择完整版
1.2 外接入方式部署
1.2.1 元数据库准备
选择一个 DM8 数据库作为 DMHS 管理平台的后台数据库,然后在该数据库中登录SYSDBA用户,执行 dmhs_manager.sql 来创建元数据,dmhs_manager.sql 脚本在 dmhs/scripts目录下。
配置 DMHS 管理平台的后台数据库的连接信息为刚准备的DM8数据库,配置在home/dmhs/web/webapps下的manager.war 中的WEB-INF/config/connectPool.xml。
1.2.2 运行 Tomcat 服务
将manager.war 放入 Tomcat 的 webapps 目录下面,运行 Tomcat 服务。运行脚本
可以参考 dmhs/bin目录下面的 DmhsWebService 脚本模板,更改下里面的根目录环
境变量即可。
更改dmhs和tomcat路径:
启动tomcat:
Tomcat 服务启动之后,稍等片刻就可以通过浏览器访问 DMHS 管理平台,
访问地址:http://Tomcat 所在机器 IP:8080/manager。
登录界面的用户名账号(admin/888888)。
1.2.3 Agent接入
DMHS Agent 程序目录在dmhs/hs_agent目录中,执行程序名为 dmhs_agent,默认配置文件名为 dmhs_agent.xml。支持 DMHS 客户端的基本配置如下(item 标签非必填项):
<hs_agent> <name>agent_name</name> <lsn_port>5456</lsn_port><!—必填参数。管理监听端口,用于web服务器连接测试,同一个机器上的 多个dmhs_agent进程必须使用不同的监听端口。 --> <status_interval>3</status_interval><!--轮询后台dm8数据库操作表间隔,单位:s。默认值3s--> <status_server>223.254.7.183</status_server><!—后台dm8数据库ip,不可写127.0.0.1或localhost --> <status_port>15236</status_port><!—后台dm8数据库端口,可为空,默认:5236 --> <status_user>SYSDBA</status_user><!—后台dm8数据库用户名,可为空,默认:SYSDBA --> <status_pwd>SYSDBA</status_pwd><!—后台dm8数据库密码,可为空,默认:SYSDBA --> <dmhs_support>1</dmhs_support><!--是否支持dmhs客户端监控,0不支持,1支持,默认0 --> </hs_agent> |
如果用户系统中存在已有的 DMHS 服务需要进行监控,那么可以将 DMHS服务配置在 item 标签中,作为 hs_agent 的子节点添加到配置文件中。item 配置方法如下所示:
<hs_agent> …… <item><!--支持配置多个dmhs_server--> <name>DMHS_NAME</name><!—每个dmhs必须使用不同的实例名--> <startup_flag>1</startup_flag><!--dmhs_server启动的方式,0:前端命令方式启动;1:系统服务 方式启动。2:服务脚本方式启动。默认为0--> <auto_start_hs>0</auto_start_hs><!--dmhs_server自动拉起,0:不自动拉起;1:自动拉起。默认 为1,dmhs_support为1时不支持自动拉起--> <hs_dir>/opt/dmhs/bin</hs_dir><!--dmhs_server所在的bin目录--> <xml_path>/opt/dmhs/bin/dmhs.xml</xml_path><!--dmhs.xml/dmhs.hs配置文件完整路径--> <svr_name>DMHS SERVICE</svr_name><!--dmhs_server服务名或者服务脚本名,服务脚本方式 和系统服务方式启动时需要配置,前端命令方式则可以不用配置--> <server_ip>223.254.7.183</server_ip><!--dmhs_server的mgr服务ip地址--> <mgr_port>5345</mgr_port><!--dmhs_server的mgr服务端口号--> </item> </hs_agent> |
本例的dmhs_agent.xml配置如下(关于stat后面会介绍):
启动:
1) 确保后台DM8元数据库服务已正常启动;
2) 确保后台DM8元数据库中已初始化相关表,初始化脚本 dmhs_manager.sql 存放于
dmhs/scripts目录中;
- 在 hs_agent 目录中,执行以下命令:
./dmhs_agent dmhs_agent.xml |
关闭:
1) 确保 DMHS Agent 获取到的所有命令已执行完毕;
2) DMHS Agent 服务控制台执行以下命令:
exit |
Agent的后台服务运行脚本模板在dmhs/bin/service_template目录下,可以参考DmhsAgentService 服务脚本,更改下模板中的 DMHS_HOME、PROG_DIR、CONF_PATH
环境变量即可。
启动Agent:
1.2.4 Stat接入
DMHS 状态监控进程程序目录在dmhs/bin/Stat目录中,执行程序名为 dmhs_stat,默认配置文件名为 dmhs_stat.xml,说明如下:
?xml version="1.0" encoding="GB2312" ?> <dmhs_stat> <base> <lang>ch</lang><!-- 运行日志显示语言 ch 中文;en 英文;--> </base> <dmhs_conf> <hs_xml_path>/opt/dmhs/bin/dmhs.hs</hs_xml_path><!-- dmhs 部署全路径,含配置文件名称 --> <server_ip>192.168.10.10</server_ip><!-- dmhs 部署服务器 IP--> <mgr_port>5345</mgr_port><!-- dmhs 部署管理端口--> <startup_flag>2</startup_flag><!--dmhs_server 启动的方式,0:前端命令方式启动;1:系统服务方式启动 2:服务脚本启动方式。默认配置为 2--> </dmhs_conf> <stat_conf> <stat_module_alive>1</stat_module_alive><!-- 监控 dmhs 模块状态标记,启用配置为 1,不启用配置为 0 --> <module_alive_interval>60</module_alive_interval><!—模块状态监控间隔,单位为秒 --> <stat_statistic>1</stat_statistic><!-- 监控 dmhs 运行统计信息,启用配置为 1,不启用配置为 0;对源端有效 --> <statistic_interval>60</statistic_interval><!-- 统计信息监控间隔,单位为秒 --> <stat_thr_info>1</stat_thr_info> <!-- 监控 dmhs 目标端运行线程信息,启用配置为 1,不启用配置为 0;对目标端有效 --> <thr_info_interval>60</thr_info_interval> <!-- 运行线程信息监控间隔,单位为秒 --> <stat_lag_info>1</stat_lag_info> <!-- 监控 dmhs 运行延时信息,启用配置为 1,不启用配置为 0;对目标端有效 --> <lag_info_interval>60</lag_info_interval> <!-- 延时信息监控间隔,单位为秒 --> <stat_errlog>1</stat_errlog> <!-- 监控 dmhs 运行日志信息,启用配置为 1,不启用配置为 0;--> <stat_machine>1</stat_machine> <!-- 监控 dmhs 运行服务器资源信息,启用配置为 1,不启用配置为 0; --> <machine_interval>60</machine_interval> <!-- 服务器信息监控间隔,单位为秒 --> <disk_limit>0</disk_limit> <!-- 配置 dmhs 所在磁盘空间超阈值后,停止 dmhs 进程;启用配置为 1,不启用配置为 0;默认配置为 0 --> <disk_use_rate>90</disk_use_rate> <!-- dmhs 所在磁盘空间阈值,单位为百分比,取值范围 0-100,默认配置为 100 --> </stat_conf> <database> <!-- 监控信息入库数据库配置 --> <db_server>192.168.10.11</db_server> <!—后台数据库服务器 IP --> <db_user>SYSDBA</db_user> <!—后台数据库登陆用户名--> <db_pwd>SYSDBA</db_pwd> <!—后台数据库登陆密码--> <db_port>15236</db_port> <!—后台数据库端口--> </database> </dmhs_stat> |
本例的dmhs_stat.xml配置如下:
DMHS 状态监控程序名称为 dmhs_stat,根据监控需要,配置好上述所示配置文件后,直接启动程序即可。另外需要以后台方式启动的可以参考dmhs/bin/service_template 目录里的 DmhsStatService 脚本模板。程序有相关运行日志可供检查运行状态。
启动Stat:
------------
以上的Agent和Start是在本例的DMHS目的端上配置的,可以同样的方式在源端上配置,这里不在复述。
2管理平台登录登出
2.1 界面登录
Tomcat Web 服务成功启动之后,在浏览器输入 DMHS 管理平台登录地址,例如
http://223.254.7.249:8080/manager/,将显示登录界面,如下:
超级管理员默认登录账号密码为 admin/888888。
2.2 管理平台主页
输入用户名密码后,点击登录,将进入 DMHS 管理平台的主页,如下图:
2.3 总体详情饼图
DMHS 管理平台主页上面部分显示了管理平台中各进程和同步链路的总体详情四个饼图,分别是 DMHS 代理进程总体详情、DMHS 状态监控进程总体详情、DMHS 实例进程总体详情以及 DMHS 同步链路总体详情。各饼图下面还显示了运行中和已停止的进程数或者同步链路数,方便运维人员了解整个平台中异常的进程和同步链路。
2.4 主机资源监控
DMHS 管理平台主页中间部分显示了管理平台中所有主机资源负载情况,以表格形式展示,主要包括 CPU、内存、磁盘 IO 以及网络 IO 等一系列监控指标。如下图所示:
2.4.1 主机负载监控
点击操作列下拉菜单中负载监控,可以对主机的内存、CPU、网络 IO 以及磁盘 IO 进
行动态监控,默认自动刷新间隔为 5 秒,如下图所示:
自动刷新间隔可以在面板的左上角进行设置,如下图所示:
2.4.2 主机负载统计
点击操作列下拉菜单中负载统计,可以对主机一段时间内的内存、CPU、网络 IO 以及
磁盘 IO 进行统计分析,默认是获取 30 分钟内的主机负载统计数据,如下图所示:
2.4.3 主机磁盘分析
点击操作列下拉菜单中磁盘分析,可以对主机一段时间内的磁盘使用率进行统计分析,
并显示当前各磁盘块的使用情况,默认是获取 30 分钟内的磁盘使用率统计数据,如下图所
示:
2.4.4 主机删除
操作列下拉菜单中的删除功能是特意为清除那些无用的主机所预留的入口,方便运维人员对平台中的主机进行管理。为了防止误删,删除之前做了主机在线检查,只能删除长时间内没有收到监控信息的主机。
2.5同步链路监控
DMHS 管理平台主页下面部分显示了管理平台中所有同步链路的运行情况,以表格形式展示,主要包括同步状态、模块状态、发送/接受次数、消息流量、分析队列/活动事务、文件 IO 次数/影响行数、日志时间/检查点时间、异常数、警告数以及操作列。如下图所示:
鼠标放到同步链路源/目的站点上,可以看到更详细的信息,如下图所示:
同步状态主要有三种状态:运行中、已停止、待确认,其中待确认状态有几种情况:
1) 源端和目的端都处于待确认状态,说明源端的 Stat 进程异常或者 Stat 的采集同步信
息的线程退出了,后台数据库里存储的不是最新的统计信息,已失效,需要人为去
看下源端的 Stat 进程情况;
2) 源端处于待确认状态,目的端处于运行中状态,说明源端的日志分析时间长时间没
有变动,极有可能源端日志分析卡住了,需要人为去看下源端情况;
3) 源端处于运行中状态,目的端处于待确认状态,说明目的端的检查点时间长时间没
有变化,极有可能目的端检查点没有推进了,需要人为去看下目的端情况;
异常数记录了当前 DMHS 实例日志中出现的[ERROR]的日志片段数,点击进去可以查
看同步异常历史信息列表,如下图所示:
双击异常信息可以查看更详细的错误日志信息
---------------------------------
关于DMHS管理平台的更多说明,请参阅《DMHS管理平台用户手册.pdf》