摘要:
随着信息技术的不断发展,大量不同类型的数据呈现了更快速的增长趋势.但是快速收集,访问这些数据并不能产生价值,必须通过数据分析才能发现感兴趣数据间隐藏的有价值信息和关联规则,因此大量的数据分析平台应运而生.传统数据分析平台面向的用户几乎都是领域内的分析人员,他们必须具有熟练掌握数据分析相关专业知识的能力,才能正确的使用平台进行数据分析.同时,传统数据分析平台开发环境搭建困难,其基于单机运行的服务架构,存在算法运行性能低,平台开放性和共享程度差等问题.针对上述问题,本文提出一个基于HTML5的数据分析建模系统,采用分布并行的Web服务架构,为用户提供了基于服务的在线算法开发和可视化的分析流程建模环境.该数据分析建模系统操作简单,降低了对分析人员专业技能的要求和开发数据分析模型的难度,支持用户自定义算法集成,复用和发布共享.主要的研究工作有以下三点:(1)根据组件的可定制性,复用性,互操作性和自包容性,从模型节点,模型连接,子模型三个方面对系统模型进行定义,快速实现组件的可视化集成.(2)以组件节点和连接为基础单位进行可视化建模,根据模型定义快速提取模型JSON数据.同时基于HTML5的WebSocketAPI进行数据交互,为系统提供一个算法的在线开发工具,方便用户进行自定义算法的组件发布.(3)系统采用B/S架构体系,在应用服务器端,设计并实现了数据分析模型的执行引擎,基于WebSocketAPI交互解析模型数据,实时返回数据分析模型执行的可视化结果.本文设计并实现的基于HTML5的数据分析建模系统,降低了对用户的专业技能要求,不但交互体验流畅,开发效率高,复用性好,而且服务端运算能力强.目前,本系统已经在研究院内部得到应用,系统的稳定性和实用性得到了验证.
展开