通用数据挖掘系统 V3.0
使用说明
(1) 目录清单:
src下是源代码。其中,hjk是作者开发的工具类包,本程序有多项依赖于它。Dms30是本程序主代码包,DmsClient.java是客户端主程序,DmsServer.java是服务器端主程序,DmsProcessor.java是多线程数据处理核心。
wtmpx.zip是unix原始记录样本文件,解压后可以作为测试样例。
DMS_Client.jar是可执行的客户端java程序。
DMS_Server.jar是可执行的服务器端java程序。
DMS_lib下是dom4j等相关jar包。
(2) 操作说明
本系统的工作模式是数据采集分散在各应用端,即unix实验室主机上,由客户端程序实时采集、匹配用户登录数据后,统一发送到中心服务器进行集中处理并存储到数据库,并定期产生报告数据到数据库
以备前台计费查询和运算。
1. 部署服务器端程序到中心服务器,测试数据库连接,如图所示:
程序会自动打开一个记事本,请参照样本编辑数据库连接参数。如果数据连接测试不成功,则你只能测试分类存储到文件功能。
2.程序默认已经启动实时分类和存储服务,如需测试分类和存储为文件服务,请显示启动它:
3. 部署和启动客户端程序,程序启动时会让你选择unix原始记录文件所在位置,以及数据备份目录:
4. 配置中心服务器地址,这之前可能你需在服务端程序中查看服务主机的IP,如图所示:
输入正确的服务端地址:
5. 测试、初始化和启动服务:
(3)功能说明
用户在线时间记录数据默认每30分钟采集、传输到中心服务器,实时存储至数据库表中;默认每天凌晨3时汇总上一天用户在线时间形成日报表;默认每月的5号汇总上一月用户在线时间形成月报表;默认每年第一月的5号汇总上一年用户在线时间形成年报表。