数据中台一体机技术白皮书

​​​​​

1.产品架构

1.1 产品概述

        数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。通过数字化转型以发挥数据要素对于企业的生产经营价值成为大多数企业的必然选择。数据中台承载着利用数据驱动业务决策所需的一系列能力,是众多企业建设数据能力、开展数字化转型时难以避开的话题,部分企业已经将其作为企业数字化转型的核心引擎。

        当前数据中台已成为企业综合数据能力建设的一种形式。数据中台是企业数据价值实现的能力框架,包括数据存储汇聚、数据开发、数据管理、数据服务、数据资产运营等能力。在企业层面数据中台是企业业务数据化的承载体,是企业业务通过数据视角的一种呈现,担负了企业数字化所需的核心综合数据能力。

        数据中台一体机是数据中台与硬件的结合体,可以快速部署并把硬件性能发挥到最佳,通过数据中台一体机把数据汇聚、统一后,形成标准数据,并进行存储,形成大数据资产,进而为客户提供高效服务。这些数据服务跟企业的业务有较强的关联性,是企业独有数据资产并且可复用,是企业业务和数据的沉淀。通过数据中台一体机形成的企业数据资产不仅能降低重复建设、减少烟囱式协作的成本,也是数智化时代企业差异化竞争的优势所在。

1.2 产品定位

        橙鸟数据中台一体机是一套集“数据建设与运营方法论+软件产品+数据技术服务”的中台体系。本产品提供数据采集、融合、治理、计算、分析、服务、可视化的全链路一站式管理与服务,同时建设符合国家和行业标准的数据资产目录,遵从数据可用、可见、可运营的建设与运营原则,创新性地将“数据资产”作为业务价值的基础要素凸显出来,打造业务和数据的闭环,持续赋能行业应用。

        A、数据建设与运营方法论

        数据建设与运营是一个持续的过程,本质是建设一套可持续让数据用起来的机制。产品通过长期的行业沉淀,向业务赠送符合行业特性,提供各类数据资源梳理、采集、融合、治理、服务开发、运维运营的方法论体系。

       B、软件产品

        涵盖数据集成、开发、治理、管理、分析、服务、安全、运维等功能。

       C、数据技术服务

        伴随数据中台交付提供的数据集成、加工、建模以及基于国家和行业标准定义数据资产目录等数据服务。

1.3 产品价值

1.3.1 社会价值

《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(数据二十条)指出:数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式。数据中台的建设能够帮助企业培养数据资产认知、提高数据资产管理水平、充分实现数据要素价值、繁荣数据要素市场,为数字经济发展繁荣做出重大贡献。

1.3.2 业务价值

1.3.2.1 数据全生命周期管理

橙鸟数据中台一体机提供统一的数据生命周期管理,基于完善的数据治理体系,从数据标准、接入、计算、存储、组织、治理、服务,保证数据资产的有效利用和价值最大化,做到真正的数据资产化、服务化。

1.3.2.2 多源异构数据集成

数据中台一体机支持以全可视化方式接入多源异构数据,包括结构化、半结构化和非结构化等数据类型,包括MySql、Oracle、DB2、MogoDB、Hive等20+种数据源,同时支持ETL、API、CDC、OLAP实时等数据接入方式。

1.3.2.3 全链条数据治理服务

数据中台一体机提供数据标准管理、元数据管理、生命周期管理、数据质量管理,同时打造一体化数据治理体系,从多个层面定义数据质量规则,全面监控数据全生命周期各环节,实现全面稽核和预警,通过严谨的数据质量评分机制,让数据治理有理有据。

1.3.2.4 强大的数据数据挖掘分析能力

数据中台一体机面向不同的数据处理场景,针对不同的数据处理人群,提供可视化数据分析计算工具,通过可视化拖拽的方式,可完成业务模型设计和数据分析工作,支持海量数据挖掘分析碰撞,实现离线数据、实时数据快速融合处理,降低了技术门槛,大幅提高数据开发效率和降低开发成本。

1.3.2.5 多维数据资产管理

数据中台一体机通过数据资产目录、资产检索、资产溯源等功能清晰地描述数据资产,拉通业务元数据和技术元数据,支持海量数据资产全文检索,帮助数据管理员轻松地管理与运营数据资产,实现资产可视、可找、可用、可运营。

1.3.2.6 SAAS服务,多租户能力

数据中台一体机支持多租户,并分级权限管理,对原始数据、成果数据、算法模型和微应用提供分级管控。

1.3.2.7 灵活适配,轻松部署

数据中台一体机全面适配各种底层存储计算平台,包括HDP、CDH、华为FI以及MPP数据库Mysql、Oracle、DB2等。可以根据项目规模灵活选择项目方案(单机版或集群版),支持容器化部署,对于零基础用户半小时可轻松完成全套产品部署。

1.3.2.8 低代码,敏捷开发

数据中台一体机全流程可视化,操作简单、快速,使用门槛低,零代码,支持多源数据采集、数据综合治理、数据挖掘分析、主数据管理、数据共享、数据可视化等,能够在不同环境自由切换,大幅提升数据开发与治理效率。

1.3.3 技术价值

数字化转型的需求必将催生多元化的数据场景,而多元化的数据场景将会带来更多的技术需求,数据中台一体机在技术上进行了探索与创新。

产品一方面采用真正的原生的分布式框架,可扩展性非常强。其技术特点如下:

  1. 容器化封装:以容器为基础,提高整体开发水平,形成代码和组件重用,简化云原生应用程序的维护。在容器中运行应用程序和进程,并作为应用程序部署的独立单元,实现高水平资源隔离。
  2. 动态管理:通过集中式的编排调度系统来动态的管理和调度。
  3. 面向微服务:明确服务间的依赖,互相解耦。兼容开源标准,客户无需修改代码就可以平滑接入微服务技术架构。

产品另一方面实现支持实时计算引擎、离线计算引擎、交互式查询引擎等多种引擎的融合计算。把不同计算模式由不同引擎拼接起来这样一个架构变成一套融合的架构,即用一个引擎支持不同的计算模式。计算效率比以往传统计算模式有极为明显的提升。可帮助用户快速、持续、可靠、规模化地交付数据场景。

1.4 产品用户

数据中台一体机可为六类用户即:数据开发者、数据管理者、数据消费者、系统运维工程师、系统管理员、租户管理员,分别提供所需服务。

1.4.1 数据开发者

数据中台一体机为数据开发者数据处理、加工带来便捷性、稳定性、高质量的数据产出。

  1. 数据集成以全可视化方式接入多源异构数据,包括结构化、半结构化和非结构化数据等,支持批量数据迁移、实时数据集成和数据库实时同步。通过对数据集成任务的配置、管理、监控、调度,提高数据集成效率,为数据价值挖掘奠定坚实基础。
  2. 数据开发满足用户对于加工开发、任务调度、运维监控等需求。面向不同的数据处理场景,针对不同的数据处理人群,提供脚本开发、拖拽式设计开发工具,实现离线数据、实时数据快速融合处理,大幅提高数据开发效率并降低开发成本。
  3. 数据治理通过数据标准、数据质量、数据血缘、数据指标、数据标签、智能治理构建的综合数据治理能力,提供多种聚焦视角来助力构建、管理数据,洞察和挖掘数据价值。通过务实的数据治理方法论和产品功能组合,形成高质量的数据资产,从而实现组织数据高价值回报。

1.4.2 数据管理者

数据中台一体机为数据管理者提供全局资产盘点、数据安全管控和数据全链路时效性监测的能力。

  1. 数据资产管理提供可视化的资产视图,全面盘点数据资产,从业务视角对数据的接入、使用、质量等实现全面感知,帮助数据管理者做到对数据资产的全局把控、清晰查看、智能运营。
  2. 数据安全体系为用户提供数据分类分级、访问监控、审计能力,依据数据的敏感与涉密程度,通过字段分级的方式,数据管理者能实现对敏感数据访问的管控,为数据的使用安全提供流程上的保障。
  3. 监测数据从源头到使用的时效性,定位影响链路时效性的环节并做风险预警,辅助数据管理者掌握数据全链路流转的健康程度。

1.4.3 数据消费者

数据中台一体机为数据消费者提供统一门户、统一目录、统一服务,实现信息一站式共享、多视角分析、全链条查询的能力。

  1. 资产门户实现信息资源共享、业务协同和数据开放的基础,是各部门之间信息共享的依据。提供统一的资产目录,数据消费者可通过搜索、标签、最新、推荐等快速定位所需数据资产。

     2.从资源申请、管理审批到最终的数据消费,秉持“谁生产,谁负责”的数据责任逻辑,大幅缩短数据消费链路,提升数据使用时效性与管理效率。

1.4.4 系统运维工程师

数据中台一体机为系统运维工程师提供强大的作业调度与管控能力,使得组织更加方便、全面地了解数据处理的运行情况。通过数据全生命周期的监控、告警,有效保障数据供给稳定。

  1. 全面托管的调度集中管理各类型的数据作业,支持按分钟、小时、天、周和月等进行统一调度,使得用户可以更加方便、全面地了解数据处理的运行情况。
  2. 可视化的任务运维中心,监控所有任务的运行,支持配置各类报警通知,便于运维人员实时获取任务情况,全局掌控运维健康程度,保证业务正常运行。
  3. 对数据全生命周期进行全链路监测,集中监控数据处理任务和作业性能,从全局视角辅助系统运维工程师快速定位异常并排除故障。

1.4.5 系统管理员

数据中台一体机为系统管理员提供空间管理、各空间通用信息的配置管理、数据中台交付资产统计等功能。

  1. 引入租户权限模型,租户之间的资源(含数据和功能)彼此逻辑隔离,各租户独立管理自有的数据、权限、用户。通过字段等级定义提供字段级安全访问控制。
  2. 提供通用信息的配置管理,如:资产类目配置、类目管理、外观配置、在线文档配置、数据标准管理、元数据管理等。
  3. 统计数据中台交付过程资产,如:数据资源、数仓各层级、数据源、数据作业及任务的情况,为租户管理员了解项目的交付状态,做项目阶段性总结提供数据支撑。

1.4.6 租户管理员

数据中台一体机为租户管理员提供数据中台全局能力,并支持做本空间下的角色管理、用户管理、大屏配置。

  1. 提供数据集成、开发、治理、资产管理、数据开放、数据安全、系统运维的全局能力,利于空间管理员统筹管理本空间下的各类资源。
  2. 数据大屏既支持展示真实数据,也可通过“立体剪裁”的方式手动配置大屏的模拟数据,各租户用户可见本空间的大屏数据。

     3.各租户用户独立管理自有的数据、权限、用户,通过角色管理、用户管理,灵活为本空间下的用户配置权限,包括菜单权限、功能权限、资源权限。

2.产品架构

2.1 技术架构

2.1.1 总体架构

数据中台一体机主要由数据集成、元数据管理、数据质量标准、主数据管理、数据可视化建模、数据可视化BI、数据资产管理和数据大屏8部分组成。总体架构如下图所示:

  1. 数据集成:提供可视化的数据集成工具图形界面,支持数据源集成、API集成、文件集成、ETL离线数据集成、Excel集成等,并支持把所有集成的数据存储数据仓库,并支持自定义分层和数据编目。
  2. 元数据管理:提供元数据登记、维护、元数据查找和分析等相关功能,并对全部元数据管理过程的动作进行记录,形成元数据管理档案。
  3. 数据质量标准:提供数据质量和标准的图形化管理工具,数据质量标准是指在数据获取、传输和保存过程中,应遵守的最低质量要求,包括数据完整性、数据准确性、数据一致性、数据可靠性和数据可用性等。
  4. 主数据管理:可以通过智能化分析、数据建模等方式,将海量碎片化的异构数据进行组织、连接,形成“关系网”,“关系网”中的数据与现实世界中的人、事、物、时间、空间等一一对应,并且以可视化的方式展现对象之间复杂交错的关系,实现将数据投影成为影像,让用户可以更加直观的捕捉到数据中隐藏的关联信息,从而形成主题数据。
  5. 数据可视化建模:为用户提供的自助式数据挖掘分析工具,是一个用于数据分析的可视化工具。用户可以把自己的业务思路,注入到自助式数据分析建模工具模型中,根据经验形成一个成熟的研判模型。提供基于工作流的、交互式的算法定制开发工具,支持用户在画布上以拖拽的方式编排算子构建业务分析流程。系统内置丰富的数据分析算子,并支持用户自定义丰富的业务模型资产。
  6. 数据可视化BI:提供数据大屏应用模块组件,支持包括折线图、柱状图、饼图、雷达图、热力图、仪表盘等图表展现;支持GIS地图集成,提供表格、文本等多类型组件数据展现能力。并支持预制各类业务模版,可动态自由组合二位数据,通过拖拽的方式进行系统设计完成业务需求,零代码。
  7. 数据资产管理:支持各类数据资产目录展示,包括数据表资产目录、API接口资产目录、数据标签资产目录、第三单方API集成目录等。
  8. 数据安全与运维:提供任务监控管理和数据安全管理相关功能。包括租户管理、审计日志管理、数据脱敏等功能。

2.1.2 技术架构

数据中台一体机技术架构如下图所示:

  1. 基础支撑层:主要是围绕支撑平台运行的软硬件环境,虚拟化环境,分布式大数据平台环境等。
  2. 数据采集层:支持ETL、kettle等离线数据同步工具,支持kafka/MQ等实时消息,支持第三方API集成。
  3. 数据计算层:包括离线计算、实时计算、流计算、图计算等。
  4. 数据存储层:支持自定义数据分析引擎,目前主要支持的连接器有mysql、oracle、postgreSQL、SQL-server、MariaDB、Hana、HBase、ES、Openguess、Hive、kafka、Mongodb、Kylin、Clickhouse、Greenplum、mymory等。

     5.数据共享:提供API数据共享接口,支持主动推送中间库功能,支持试试推送消息中间件功能。

2.1.3 业务架构

数据中台一体机业务架构如下图所示:

图 23 业务架构图

基于数据资源的需求分析和愿景目标,结合设计规划方法论、原则和规划思路,制定数据中台一体机的核心业务体系,主要包括数据集成接入业务、数据加工处理业务、数据组织管理业务、数据综合治理业务、数据资产共享服务业务、数据挖掘分析业务、数据可视化应用业务。同时,将数据安全和数据标准融入体系之中,通过智能演进不断提升数据接入、处理、组织、挖掘、治理和服务的能力,不断丰富和完善数据中台一体机。

2.1.4 逻辑架构

数据中台一体机逻辑架构如下图所示:

图 24 逻辑架构图

针对多源异构的数据场景,在数据组织层面为数据的接入、融合及智能数据应用服务等提供稳定、高效的支撑。从数据的接入方式、存储方式、加工方式、使用方式等方面综合考虑,资源库是在原始库的基础上进行数据的规范化治理及基于数据主题的整合;主题库是以原始数据、资源数据为基础,构件实体关系模型,并在此基础上形成的知识图谱和事理图谱等;业务库是为了支撑不同业务场景所定义的相关数据结构。知识库是专业领域或与专业领域相关的特征知识数据和规则方法集合。此外还包括整合数据索引信息的统一索引库;记录了本平台及与平台相关的数据的属性、位置、数据 量、权限等基本信息的数据资源目录;记录了技术元数据、业务元数据、管理元数据的元数据库;以及为交互分析挖掘规划的数据实验空间和记录平台相关管理配置信息的管理信息库。

2.2 核心业务

2.2.1 数据集成接入业务

2.2.1.1 业务架构

采用统一的数据接入模式,以标准化、模块化的方式进行多源异构数据资源的接入;提供采集全面、动态可配的数据接入机制,实现数据的获取分发、策略配置、任务配置、任务调度、数据加密、断点续传等数据接入功能;当接入时,同时维护数据资源目录,以及数据血缘信息。

图 25 数据集成接入业务-业务架构

2.2.1.2 数据流程

提供一站式的数据迁移接入功能,内部数据通过专用数据通道进入统一接入平台,可在接入过程中做初步的清洗加工,并提供可视化的任务调度运行管理,并向数据智能管理和数据治理提供数据支撑。

图 26 数据集成接入业务-数据流程

2.2.2 数据组织业务管理

2.2.2.1 业务架构

数据通过原始库->资源库->主题库->知识库->业务库->数据资源目录形成数据的统一管理。

图 27 数据组织管理业务-业务架构

  1. 数据在原始库中形成数据缓存层,以支持数据加工。同时实现了非结构化数据的关键信息的提取、数据分级分类标签等处理。原始库对外提供了查询、比对、推送、订阅等服务。同时为后续的数据血缘追踪提供溯源支持。
  2. 资源库是对原始库数据进行清洗标准化及轻度整合,形成全量数据的持久化层。资源库对外支持数据的分类检索、轨迹碰撞,及明细数据的统计、分析、比对、推送、订阅等服务。
  3. 主题库通过归并及建模,形成全息视图,并且通过实体间的关系构成了关系类知识图谱和事理图谱。对外在各中心共享了实体间的关系,并完成实体标签、数据分析、统计、比对等服务。
  4. 知识库对外支撑知识类数据的查询以及模型工程、标签工程等服务。
  5. 业务库中的业务专题库实现了业务专题类分析,业务知识库汇聚了单一业务系统的知识,业务实体库中构建了业务的相关模型,业务资源库是对业务的相关数据支撑。在此基础上,实现了对外的数据统计、分析、推送及碰撞等服务。

     6.数据资源目录对外支撑各部门对数据资源目录的查询。

2.2.2.2 数据流程

数据组织过程通过分层实现,经过标准化、对象化的处理过程,提高数据质量和数据价值。

图 28 数据组织管理业务-数据流程

  1. 数据源:在接入时,一般直接进入原始库。也可直接分发,进行数据处理,存储到资源库或业务库。
  2. 原始库:数据经过按需提取、清洗、关联、比对、标识(也就是数据标签)等多种数据处理后,进入资源库。
  3. 资源库:资源库中可以进行结构化数据提取和清洗去重,净化数据;资源库数据在通过对象化提取、清洗归并,进行关联和标识(对象标识),输出到主题库。
  4. 主题库:经离线归一化(Idmapping)计算、关联和标识(包括对象标识),计算结果可以输出到主题库或业务库。
  5. 业务库:业务库内部数据也可以按需进行数据处理,供业务系统使用。
  6. 知识库:资源库、主题库和业务库均有可能用到知识库,通过对资源库、主题库和业务库进行挖掘,可反哺和进一步完善知识库。

2.2.3 数据综合治理业务

2.2.3.1 业务架构

数据综合治理是通过管理数据资源目录、元数据、分级分类、血缘关系、主数据管理、等信息保障数据汇聚与融合后的效果,规范数据组织形式;同时对数据质量进行管控,通过运维手段确保数据全生命周期的高质量运行,通过数据运营变现数据价值。

图 29 数据综合治理业务-业务架构

2.2.3.2 数据流程

数据综合治理主要归纳为:元数据治理、数据质量治理、主数据治理。所有数据进入数据中台时,首先进行元数据登记,其次进行元数据治理(包括数据表明、字段的修改变更、数据打标签、数据字典等等);然后进行数据质量校验分析;最后可通过主数据工具提供的能力围绕业务需求构建主数据(主数据治理)。

图 210 数据综合治理业务-数据流程

2.2.4 数据资产服务业务

2.2.4.1 业务架构

数据资产服务包括数据资源目录,通过打标签,发布数据表、发布API等,可以生产满足业务需求的各类数据目录。同时提供数据全生命周期管理功能,根据业务需求,可以配置数据管理策略,例如定期归档数据,定期删除数据等。

图 211 数据资产服务业务-业务架构

2.2.4.2 数据流程

所有进入数据中台的数据,包括原始数据、业务数据、模型成果数据等,都需要通过元数据管理进行注册登记。登记后的数据才能在数据中台体系中通行。登记后的数据也同时在数据资产目录中可以看到,包括能够生成对应的API服务等。

图 212 数据资产服务业务-数据流程

2.2.5 数据挖掘分析业务

2.2.5.1 业务架构

从下至上分为数据源层、数据集成服务层、工具支撑层、应用服务层、场景层。

图 213 数据挖掘分析业务-业务架构

  1. 数据源层:本层是各类数据的来源,包括公安内部的结构化和非结构化的数据,以及可以在业务支持下提供外部如互联网之类的数据等。
  2. 数据集成服务层:包括数据接入管理,通过数据抽取的服务工具来对结构化和非结构化数据的抽取,在抽取的时候可以通过接入配置相关的功能来进行配置及抽取任务的管理,从而达到定时、定量的接入各类数据;数据处理,在系统中对于数据是实时接入的,在接入的同时也对数据进行了实时的处理。针对结构化数据我们进行了清洗和加工的操作,针对非结构化数据如图片进行标注和特征提取的操作;数据管理,数据在入库以后,进行统一的数据管理,在管理方面,包含了数据资产、数据维度、数据坐标、数据共享这几块的内容,通过这些方式,对数据进行全方位的掌控。
  3. 工具支撑层:提供知识图谱生成工具,可视化建模工具和关联关系分析工具,知识图谱是智能研判的核心内容,是构建以人为核心的相关业务,通过一系列的数据操作形成人员主题模型;同时通过模型管理、关系管理、标签管理来对人的相关业务数据进行管理。
  4. 应用服务层:体现了平台随想即成,随需而变的理念,在功能应用方面我们通过对公安业务的高度总结凝练,形成了信息查询、关系拓展、数据研判、实时监控、预测预警的功能应用服务体系,再结合各类可视化展示的相关功能,构建出了高效实用的应用服务模式。
  5. 应用场景层:用户的应用场景的无穷尽的,通过积累总结,针对用户的各种业务场景,推出了各种对应的业务模型,进一步形成了业务场景服务包,用时提供对外实时的模型服务,如实时预测、实时推送数据等。通过应用、API、服务、数据等方式来支撑我们自己产品的同时,也可以对外提供各种支持,如多终端的使用等。
2.2.5.2 数据流程

针对行业数据管理的痛点,将数据由分散到集中,从无序到有组织,提供数据挖掘分析服务来针对业务场景进行数据价值挖掘,通过数据开放服务来支撑应用。平台支持全生命周期的数据资管理,数据根据衍变过程可分为:基础数据、主题数据、专题数据、接口数据。

图 214 数据挖掘分析业务-数据流程

  1. 基础数据:将分布在不同的业务系统的结构化和非结构化数据,通过ETL工具、API和MQ进行统一接入,形成基础数据。
  2. 主题数据:围绕人、物、地、事等基本业务要素,将基础数据进行组织,经过元数据管理、数据标准管理、数据质量管理等数据治理过程, 形成主题数据。
  3. 专题数据:通过数据增值服务,针对不同的应用场景进行数据挖掘,形成支撑场景业务的专题数据。通过标签服务生成的标签数据,通过数据建模生成的模型结果数据,通过知识图谱生成的关系图数据等。
  4. 接口数据:开放服务将数据转换成报文协议、流数据等接口数据,与业务应用进行对接。

2.2.6 数据可视化业务

2.2.6.1 业务架构

数据可视化为整个数据中台提供了大数据可视化展示能力,为客户提供了各种可视化组件,客户可以根据自己的需求通过组件间简单组合进行数据展示。帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。

图 215 数据可视化业务-业务架构

数据可视化平台通过三维表现技术来表示复杂的信息,实现对海量数据的立体呈现。可视化技术借助人脑的视觉思维能力,通过挖掘数据之间重要的关联关系将若干关联性的可视化数据进行汇总处理,揭示数据中隐含的规律和发展趋势,从而提高数据的使用效率。在解决了海量数据分析耗时过长、挖掘深度不够、数据展现简单等问题的基础上,数据可视化使人们不再局限于使用传统关系数据表来分析数据信息,而是以更直观的方式呈现和推导数据间的逻辑关系。

2.2.6.2 数据流程

通过可视化分析展示,使抽象的数据信息变得简单、易懂,直观呈现数据分析结果,丰富的可视化组件可帮助业务准确的表达数据的价值所在,完善的功能可帮助用户建立有针对性的报表体系。其主要价值可体现在即席查询、数据洞察与大屏呈现、移动报表之上。

通过可视化分析展示,使抽象的数据信息变得简单、易懂,直观呈现数据分析结果,丰富的可视化组件可帮助业务准确的表达数据的价值所在,完善的功能可帮助用户建立有针对性的报表体系。其主要价值可体现在即席查询、数据洞察与大屏呈现、移动报表之上。

                                                       图 216 数据可视化业务-数据流程

3.产品功能

3.1 数据集成

3.1.1 数据源管理

支持手动配置生产库数据源,选择对应的生产库驱动。

图 31 数据源管理

3.1.1.1 创建数据源

创建数据源用于建立与管理相关数据源的连接关系,基于需求加载相应采集表单,引接相关数据至数据仓库。

图 32 创建数据源

3.1.1.2 数据连接管理

数据连接管理主要负责适配主流的数据库连接器,提供数据连接器的配置管理功能。目前支持的主流连接器有mysql、oracle、postgreSQL、SQL-server、MariaDB、Hana、HBase、ES、Openguess、Hive、kafka、Mongodb、Kylin、Clickhouse、Greenplum、mymory等。

图 33 数据连接管理

3.1.2 数据集成

3.1.2.1 数据目录集成

支持通过数据驱动与第三方生产系统建立数据通道,并快速拉去数据目录到本地进行存储,方便后续应用。

3.1.2.2 API集成

支持对API数据源的配置管理(协议、URL、报文格式),对API管理维护包括:增删改查、测试连通性。可查看该数据源关联的作业明细。

 图 35 API集成

3.1.2.3 文件集成

文件即非结构化数据,包括:pdf、图片、word等,均可作为非结构化数据集成的数据源进行数据同步。

图 36 文件集成

3.1.2.4 ETL集成

提供基于大数据ETL工具完成数据的抽取同步其他数据库数据的能力,包括任务维护、任务监控等。

任务维护:提供数据同步任务查询、任务创建、参数配置、任务执行、任务禁用、任务删除等基础功能

任务监控:提供任务过车监控功能,监控同步数据到数据中台。

图 37 ETL集成

3.1.2.5 excel集成

支持excel文件数据导入功能。

3.1.3 数据仓库

提供实现树状形式的对数据进行编目管理,对数据库内容依据数据种类进行一级编目,依据数据范围、数据格式(如网格数据)等条件进行二级及以下级别编目,所有编目动态生成、自动刷新,反映数据库内容的实时变化。

所有集成的数据,都统一进入到数据仓库中进行编目,并支持数据预览、数据结构展示等功能。

图 38 数据仓库

3.2 元数据管理

3.2.1 元数据维护

提供数据标签分类功能;提供数据表及字段属性维护管理功能。

图 39 元数据维护

3.2.2 元数据查找

支持按照数据库名、表名、字段名进行查找;支持热门数据查询;支持查询返回数据血缘关系、数据变更记录、数据描述信息等等。

图 310 元数据查找

3.2.3 元数据分析

数据血缘分析:展示数据从起源基数据处理全过程,描述数据之间的继承、流转、转换、关联、提取、清洗等关系,分析数据变更可能造成的影响。

数据质量分析:可以通过规则配置,在唯一性、完整性、准确性、一致性、关联性、及时性等方面对指定数据表进行匹配分析,并对问题进行归纳统计,自动化生成质量报告。

数据热度分析:对数据热度进行分析,发现并评估数据的重要性和影响范围,为资源调度和数据维护提供支撑。

图 311 元数据分析

3.2.4 变更记录

提供元数据变更日志记录查询功能。

图 312 变更记录

3.3 数据质量标准

3.3.1 数据质量

3.3.1.1 质量规则配置

提供配置需要核查的元数据信息的维护管理功能。

图 313 质量规则配置

3.3.1.2 质量问题管理

提供可查看核查的问题信息。

图 314 质量问题管理

3.3.1.3 数据质量报告

提供每天的数据治理报告信息。

图 315 数据质量报告

3.3.2 数据标准

3.3.2.1 数据标准字典

提供数据标准字典的维护管理功能。

图 316 数据标准字典

3.3.2.2 对照表配置

提供分析对照目标表配置管理功能。

图 317 对照表配置

3.3.2.3 手动、自动分析

提供手动分析、自动分析等功能。

图 318 手动、自动分析

3.3.2.4 标准对照统计

提供标准分析统计结果展示功能。

图 319 标准对照统计

3.4 数据资产管理

3.4.1 数据资产

3.4.1.1 数据表资产

在数据指标资产目录页,支持通过“搜索+类目体系”组合查询,完成对数据指标资产的定位。搜索、类目体系作为资产检索条件,可组合使用。二者的关系为“并”。

搜索:提供搜索,通过检索‘派生指标名称’进行模糊搜索。当不选择左侧类目时,即可支持跨类目搜索多个数据指标资产;当选择左侧某类目时,即可搜索某类目下且符合关键词的数据指标资产。

类目体系:类目体系默认为未选择,支持点选某一类目,显示该类目下的所有数据指标资产。

搜索结果:输入搜索条件点击【搜索】,显示检索结果列表。资产目录的检索结果列表默认按‘派生指标更新时间’倒序排序。

图 320 数据表资产

3.4.1.2 API接口资产

在API资产目录页,支持通过“搜索+高级搜索+类目体系”组合查询,完成对文件夹资产的定位。搜索、高级搜索、类目体系作为资产检索条件,可组合使用。三者的关系为“并”。

普通检索:支持通过API名称、摘要信息进行模糊查询;

高级检索:支持通过审批状态查询。

图 321 API接口资产

3.4.1.3 数据标签资产

依据不同业务场景定义数据标签,并按场景做数据标签分类,形成不同的类目及对应类目的数据标签。

在数据标签资产目录页,支持通过“搜索+类目体系”组合查询,完成对数据指标资产的定位。搜索、类目体系作为资产检索条件,可组合使用。二者的关系为“并”。

搜索:提供搜索,通过检索‘数据标签名称’、 ‘提供方’进行模糊搜索。当不选择左侧类目时,即可支持跨类目搜索多个数据标签资产;当选择左侧某类目时,即可搜索某类目下且符合关键词的数据标签资产。

类目体系:类目体系默认为未选择,支持点选某一类目,显示该类目下的所有数据标签资产。

搜索结果:输入搜索条件点击【搜索】,显示检索结果列表。资产目录的检索结果列表默认按‘数据表更新时间’倒序排序。

图 322 数据标签资

3.4.1.4 第三方API资产

        第三方API资产目录中的数据,主要是通过API集成的第三方数据集合。其功能跟API接口资产功能相同。

3.4.2 发布管理

3.4.2.1 数据发布

提供数据在线发布功能,提供样例数据、数据控制到字段。

图 323 数据发布

3.4.2.2 API发布

支持对数据表进行API接口发布。

图 324 API发布

3.4.3 数据标签管理

提供自定义数据标签维护功能,数据集成或者数据治理时,可以根据业务需求自定义打标签。

图 325 数据标签管理

3.4.4 生命周期管理

提供数据生命周期的维护管理功能,支持数据自定义归档、自定义销毁。

图 326 生命周期管理 

3.5 数据建模

3.5.1 模型工厂

模型工厂为用户提供的自助式数据挖掘分析工具,是一个用于数据分析的可视化工具。用户可以把自己的业务思路,注入到自助式数据分析建模工具模型中,根据经验形成一个成熟的研判模型。提供基于工作流的、交互式的算法定制开发工具,支持用户在画布上以拖拽的方式编排算子构建业务分析流程。

模型工厂的功能包括:模型列表、模型的维护管理;在定义模型的时候,每个结果集都是可视化展示,并可对结果集进行自定义可视化布局,两两结果集都可以根据逻辑函数碰撞分析。定义完的模型,可以一键发布到应用超市中。

数据建模的核心功能是提供算法模型的自定义编排、复用和管理功能,并构成由生成结果集组件、自定义条件过滤组件、关联碰撞分析组件、分组统计分析组件、高级分组统计分析组件、偏差分析组件等。其中关联碰撞分析中包括对数据集的交集分析、合并结果集分析、差集分析、自连接分析。自定义条件过滤中包括对结果集的二次过滤,函数有等于、小于、大于、区间、模糊查询、精确包含、精确不包含、模糊包含、模糊不包含、自定义正则表达式、字符串截取等函数库。丰富并可扩展的使用手段让分析数据变得简单易操作。

图 327 模型工厂-1

图 328 模型工厂-2

图 329 模型工厂-3

3.5.1.1 生产结果集算子

添加分析结果集支持各类业务数据,支持excel、csv、oracle、mysql等格式的数据衔接。

  1. 支持选择模板数据源、可以针对该数据源自定义条件、自定义结果列,生成结果集。建的同时支持数据的预览。
  2. 自定义条件时,可支持对字段等于、精确包含、精确不包含、大于、小于、区间、截取范围、模糊不包含、长度等于等函数对条件进行筛选。
  3. 还可支持一键对数据源生成结果集。
  4. 结果集以图标形式显示,支持查询数据,并将数据导出到 excel。
  5. 支持对结果重命名,并查看生成逻辑操作。

支持对结果集自动生成模板表。

3.5.1.2比对过滤恩熙算子

比对过滤分析主要的使用场景在于数据集的二次查询过滤,里面涵盖强大的函数库操作,使用者可按照条件规则使用平台对就的函数即可完成复杂的查询过滤操作,无论易用性还是实用性都很直观。比对过滤组件具有以下功能:

  1. 可对已生成数据源进行条件过滤(字段等于、精确包含、精确不包含、大于、小于、区间、截取范围、模糊不包含、长度等于等函数对条件进行筛选。
  2. 过滤同时支持组合排序与取前N条样本数据功能。
3.5.1.3关联碰撞分析算子

关联碰撞分析支持两个结果集的交集、并集、差集、自连接等操作算法,可自定义比对条件列、自定义结果集的显示列信息。通过灵活的配置达到使用者的要求。关联碰撞组件具有以下功能:

  1. 支持从窗口中选取两个结果集进行关联,支持自动生成第三个结果集。
  2. 比对算法支持交集自连接、交集、并集、差集。
  3. 比对条件支持可配置列。
  4. 生成结果集可支持从源结果集中进行配置。
  5. 支持关联结果数据预览。
3.5.1.4分组统计算子

分组统计功能可以对数据集进行自定义条件、自定义分组字段、组数据求和/求平均等操作,自动生成分组数量列,支持数量升序、降序排列,秒级响应。

分组统计组件具有以下功能:

  1. 支持点击结果集进行分组统计,可按过滤条件、分组字段进行设置。
  2. 可定义分组后升序、降序方式。
  3. 支持对分组后数据的可扩展计算函数支持,例如汇总、均值等。
  4. 支持分组后显示前 N 条记录。
  5. 支持对分组后的数据取临界值功能。
  6. 支持分组后对相应字段计算比例。
  7. 支持高级分组。
3.5.1.5高级分组统计算子

对结果集进行分组统计,并且可在此使用比对过滤中的函数库,自定义分组字段,自定义排序字段,自定义分组聚合字段,自定义列与列的计算算法,自定义每组显示前N条数据。高级分组统计组件具有以下功能:

  1. 支持分组后对相应字段计算比例。
  2. 支持多字段组合分组,多字段组合排序,支持分组的同时带出所有字段信息。
  3. 支持按排序取每组前N条功能
  4. 支持分组的同时对字段做聚合操作(求和、求平均)
3.5.1.6数据清洗算子

可对当前模板表/结果集的数据进行自定义清洗,清洗逻辑以流程化图形展现,清洗结果作为新列合并到模板表/结果集中。

  1. 支持自定义生成列的列名等基本属性。
  2. 支持多种运算清洗规则,包括:加减乘除等基本运算、字符串截取、字段/字符拼接、日期计算等函数运算、自定义sql逻辑等
  3. 支持多列并行操作
  4. 支持规则嵌套

     5.支持逻辑预览

3.5.2 应用超市

基于模型训练结果,通过图形化界面构建响应的应用服务,成为应用超市。应用超市针对信息查询、关系拓展、数据研判、实时监控、预测预警等五种类型的模型,提供应用模块化功能,将数据、平台工具、模型应用转化为API服务、工具服务、模型服务、推送服务等微服务向用户开放,构建微服务体系。微服务以APP的方式上架到应用超市中,供用户自主选择所需服务。

图 330 应用超市-1

根据应用的业务类型、专题类型、分组类型进行应用过滤查询,右侧输入框根据应用关键字模糊查询。找到需要使用的应用,点击卡片右下方“使用应用”即可跳转至使用界面。

图 331 应用超市-2

输入模型运行需要的参数,点击运行按钮即可;当应用开始运行后,运行记录即显示在下方记录列表中,点击运行按钮右侧的刷新按钮,可更新运行状态。

图 332 应用超市-3

当应用运行完成时,记录右侧出现查看结果按钮,点击可在弹窗中查看结果字段,顶部选项卡切换输出表,底部显示数据条数。

图 333 应用超市-4

3.5.3 应用管理

提供应用上架管理功能。

图 334 应用管理

3.6 数据大屏

3.6.1 项目管理

提供创建大屏或表格项目功能,并可通过编辑器进行大屏设计,支持各种表格图表功能等。

图 335 项目管理-1

图 336 项目管理-2

图 337 项目管理-3

3.6.2 数据集

提供在线可视化编辑SQL自定义数据集功能,为报表、表格提供数据支撑。

图 338 数据集-1

图 339 数据集-2

3.6.3 报表分析

提供大屏或者报表项目分析管理功能,可对外发布url地址,并可以设置分享时间。

图 340 报表分享

3.6.4 大屏报表

能够查看所有发布后的大屏报表数据项目,并可以预览最终效果。

图 341 大屏报表

3.6.5 表格报表

能够查看所有发布后的表格报表数据项目,并可以预览最终效果。

图 342 表格报表

3.7 安全与运维

3.7.1 监控中心

任务中心集中纳管中台的所有任务,包括数据集成、SQL开发以及数据质量,对任务做统一呈现,便于查看执行失败的任务并定位任务失败原因。其中任务状态为:等资源、运行中、运行成功、运行失败、运行超时、运行过期。

图 343 监控中心

3.7.2 数据安全

3.7.2.1 租户管理

超级管理员可以通过租户管理功能进行创建租户、修改租户、删除租户等功能。并赋予每个租户数据和功能等使用权限。租户无法访问和使用其他租户的数据和功能。

图 344 租户管理-1

管理员可以通过租户套餐功能创建租户套餐,套餐内容包括系统功能和数据权限等。创建好的套餐可以授权给租户使用。

图 345 租户管理-2

3.7.2.2 审计管理

系统操作审计指对数据中台登录操作进行监察追踪。

图 346 审计管理-1

图 347 审计管理-2

3.7.2.3 数据脱敏

数据脱敏也叫数据去隐私化,在给定脱敏规则和策略的情况下,对敏感数据比如:手机号、银行卡号等信息进行转换或者修改的一种技术手段,防止敏感数据直接在不可靠环境下使用。

为避免涉密数据在未授权情况下,直接在不可靠的环境下使用,造成数据泄露,提供数据脱敏能力。

3.8 工作流程

3.8.1 流程管理

用户可以通过流程表单维护功能创建自己的业务流程表单、修改表单、删除表单等,表单内容可以自定义。

图 349 流程管理-1

用户可以通过用户分组功能添加用户组、修改用户组、删除用户组等功能。

图 350 流程管理-2

用户通过流程模型功能创建流程、修改流程、设计流程、分配规则、发布流程、自定义流程、删除流程等功能。

图 351 流程管理-3

3.8.2 任务管理

任务管理包括我的流程、代办任务和已办任务。是项目中流程处理节点的审批信息和操作界面。

图 352 任务管理

3.9 系统管理

3.9.1 用户管理

系统管理员可以通过用户管理功能完成添加用户、修改用户信息和删除用户等基本操作。结合用户所属组织机构、所属角色等信息,可以进一步对用户进行分类,生成用户列表,利用多条件搜索功能,快速定位用户,全面掌握用户信息。

3.9.2 角色管理

系统用户采用基于角色的访问控制(Role-Based Access Control),在RBAC中,系统的权限与角色相关联,用户被赋予适当角色而得到这些角色的权限。系统中管理员可以完成以下操作:

  1. 创建、删除角色,并为角色添加相应附加信息。
  2. 配置角色权限,即该角色下用户可使用的应用超市功能和资源。
  3. 为用户分配角色,同时赋予用户该角色所拥有的权限。

通过以上三个步骤,即可完成系统角色的统一管理,达到由角色控制用户权限的目的。

3.9.3 菜单管理

系统管理员可以通过菜单管理功能完成添加菜单、修改菜单信息和删除菜单、设置菜单显示隐藏、关联菜单、配置路由、配置菜单显示图标等基本操作。

3.9.4 部门管理

单位部门管理是组织结构的重要管理手段,管理员通过单位部门的添加、修改和删除功能将用户很好的管理起来,还能够综合展示所有单位部门的信息,包括所属地区、上级部门、单位编号、全称简称等。

3.9.5 岗位管理

系统管理员可以通过岗位管理功能完成添加岗位、修改岗位信息和删除岗位等基本操作。

3.9.6 字典管理

管理员可以对数据字典灵活的进行管理维护,包括:字典的增加、修改、删除、查询。同时,用户可以对数据字典进行批量导出操作,方便用户对数据字典的移动携带。

4.技术优势

4.1 内存级数据共享交换

4.2 一站式数据集成及数据管理

4.3 数据分析模型

支持不同的业务应用。为了使平台具有灵活性和扩展性,能够完成不同业务数据的处理,将数据处理的模型和算法独立出来,以适应不同的业务要求。在具体的实施中,依据大数据处理的目标定义和选择合适的数据处理模型。

通过管理各种数据分析模型,加载样本数据,创建调度任务, 产生中间或最终结果,提供给不同的应用系统或者用户进行访问、查询等。采用具有国际标准的企业级的服务接口进行封装,从而能够满足不同的需求。通过基于Oozie工作流的方式,可视化的监控到每个分析模型的工作MR的运行情况,并且能够对分析模型进行评价和优化。

4.4 数据治理技术

4.5 数据挖掘技术

数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、数据检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

从数据本身来考虑,通常数据挖掘需要有数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。

  1. 信息收集:根据确定的数据分析对象抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。对于海量数据,选择一个合适的数据存储和管理的数据仓库是至关重要的。
  2. 数据集成:把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为组织提供全面的数据共享。
  3. 数据规约:执行多数的数据挖掘算法即使在少量数据上也需要很长的时间,而做商业运营数据挖掘时往往数据量非常大。数据规约技术可以用来得到数据集的规约表示,它小得多,但仍然接近于保持元数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。
  4. 数据清理:在数据库中的数据有一些是不完整的(有些感兴趣的属性缺少属性值),含噪声的(包含错误的属性值)并且是不一致的 (同样的信息不同的表示方式),因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。不然,挖掘的结果会差强人
  5. 数据变换:通过平滑聚集,数据概化,规范化等方式将数据转换成适用于数据挖掘的形式。对于有些实数型数据,通过概念分层和数据的离散化来转换数据也是重要的一步。
  6. 数据挖掘过程:根据数据仓库中的数据信息,选择合适的分析工具,应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息,得出有用的分析信息。
  7. 模式评估:从商业角度,由行业专家来验证数据挖掘结果的正确性。
  8. 知识库:将数据挖掘所得到的分析信息以可视化的方式呈现给用户,或作为新的知识存放在知识库中,供其他应用程序使用。

数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期目标,都需要回到前面的步骤,重新调整并执行。

4.6 可视化建模技术

可视化建模(VISUAL MODELING)是利用围绕现实想法组织模型 的一种思考问题的方法。模型对于了解问题、与项目相关的每个人(客户、行业专家、分析师、设计者等)沟通、模仿企业流程、准备文档、设计程序和数据库来说都是有用的。建模促进了对需求的更好的理解、更清晰的设计、更加容易维护的系统。可视化建模就是以图形 的方式描述所开发的系统的过程。可视化建模允许提出一个复杂问题的必要细节,过滤不必要的细节。同时也提供了一种从不同的视角观察被开发系统的机制。

4.7 知识图谱技术

数据实时处理工具能够支持大规模的知识点间关联关系的计算,能够支持百亿级关联规模的政务知识图谱管理,同时数据实时处理技术还为知识图谱计算系统在保证如此大规模的图谱知识管理下,提供了知识图谱实体及其关联更新速度达到毫秒级的保障,也确保知识图谱系统中实现了对知识图谱的星型查询速度能够达到秒级以上。

4.8 大数据体系架构

Hadoop大数据技术是新兴的数据存储、处理系统,有别于关系型数据库,实现了对海量的数据存储、分析成为可能,利用大数据技术对海量数据产生关联关系、预测行为等挖掘价值信息,使数据产生更大的价值。

4.9 采用基于J2EE技术的多层架构开发模式

系统的整体架构基于J2EE技术实现。在开发企业级应用系统方面采用J2EE技术实现具有明显优势。

4.10 基于Docker容器的组件开发技术

Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。

Docker核心解决的问题是利用LXC来实现类似VM的功能,从而利用更加节省的硬件资源提供给用户更多的计算资源。同VM的方式不同, LXC其并不是一套硬件虚拟化方法-无法归属到全虚拟化、部分虚拟化和半虚拟化中的任意一个,而是一个操作系统级虚拟化方法, 理解起来可能并不像VM那样直观。所以我们从虚拟化到docker要解决的问题出发,看看他是怎么满足用户虚拟化需求的。

4.11 基于H5、VUE的前端技术

4.12 基于spring boot 微服务架构体系

一套完整的微服务架构需要考虑许多问题,包括API Gateway、服务间调用、服务发现、服务容错、服务部署、数据调用等。基于SpringCloud构建微服务架构可以通过自动配置和绑定Spring环境和其他Spring编程模型来实现微服务。采用Spring Boot应用程序提供的集成功能,通过几个简单的注释,开发人员可以快速配置和启用应用程序中的常见功能模块,并使用久经考验的Netflix组件构建大型分布式系统。提供的微服务功能模块包括服务发现(Eureka),断路器(Hystrix),智能路由(Zuul)和客户端负载均衡(Ribbon)等。

Spring boot 多模块的架构模式。服务间通过restful接口进行数据访问。

5.配置清单

名称

型号

版本

参数配置

支撑环境

数量

适用场景

数据中台一体机

CN-SJZT-100

单机版

CPU:8核2.5GHz以上
Mem:128G
HD:1T

操作系统:CentOS 7.0
Java运行环境:JDK 1.8
数据库平台:mysql 5.7
应用平台:tomcat 7
其他:Zookeeper 3.7

1

百万级以下数据存储与治理。

CN-SJZT-200

集群版

CPU:8核2.5GHz以上
Mem:128G
HD:1T

操作系统:CentOS 7.0
Java运行环境:JDK 1.8
数据库平台:mysql 5.7
应用平台:tomcat 7
大数据套件:Zookeeper、Hadoop、Hive、Impala等

6

百万级以上数据存储与治理。

6.应用案例

6.1 【智能交通】某支队智能交通数据平台项目

本项目构建数字化交通体系,开发数字交通管理平台、数字化交通服务平台、数字化交通创新平台等,实现智慧交通和数字经济的融合发展,实现交通各环节的数字化管理、数字化服务和数字化创新。通过交通全域数据管理能力平台,旨在提供数据集成、数据模型、数据分析计算、数据治理、数据资产、数据可视化等全链路的一站式产品 + 技术 + 方法论服务,构建面向业务应用的数据智能平台。

图 61 某支队智能交通数据平台

6.2 【智慧农业】某农业园区高标准农田项目

智慧农业高标准农田项目总体架构如下图所示:

图 62 某农业园区高标准农田项目

  1. 感知层:通过传感器来全面采集各种数据,包括土壤的、空气的、水质的和动植物生理的;通过摄像头来监控动植物的生长情况、健康状况等;通过设备来调整动植物的生长、仓储等环境参数;
  2. 网络层:感知层的各种设备通过网络层设备连接到农业业务引擎。网络层支持广泛的连接接入,方便各种终端接入。常用的传输技术包括:LoRa、NB-IoT、WiFi、RS485、Zigbee、RFID等;
  3. 平台层:通过搭建物联网平台和数据智能平台一起组成混合云平台的架构。数据处理层能够把感知层收集到的终端数据做统一标准化处理,提供给上层应用。也可作为大数据的管理平台,此外还可以管理维护设备。
  4. 应用层:独立搭建生产管理系统,通过平台层的物联网和数据智能平台构建细分看板场景和智能控制体系。

6.3 【海绵城市】某城市海绵微监测数据分析项目

本项目提出的解决方案是搭建物联网平台软件 + 数据中台,解决海绵城市项目的数据分析需求。数据平台定位解决海量数据集成汇聚、数据存储、数据治理、数据分析、数据可视化等能力。

图 63 海绵微监测数据分析项目

6.4 【智慧医院】某医院数据中台项目

智慧医院建设基于5G物联网系统,可以实现患者与医务人员、医疗设备之间的连接,逐步达到全面信息化。基于物联网的数据智能平台(数据中台),旨在打造全域数据管理能力中心,提供数据集成、数据模型、数据分析计算、数据治理、数据资产、数据可视化等全链路的一站式产品 + 技术 + 方法论服务,构建面向医院业务应用的数据智能平台。

图 64 某医院数据中台项目

物联网平台通过协议适配帮助智能终端快速接入云端,采用数据存储、分析等对采集而来的数据进行预处理和深度分析挖掘物联网的数据价值,结合物联网业务逻辑、开发模版和开放能力实现物联网应用的快速上线。

6.5 【企业数字化】某企业数字化转型项目

某企业数字化转型项目整体方案如下:

  1. 打造一套数据中台产品,包括能力数据集成、元数据管理、数字资产目录(数据分层管理、API发布、数据发布等)、数据可视化建模工具、数据BI工具、业务流程管理、系统鉴权管理(支持多租户)。
  2. 利用数据中台的集成能力打通现有项目,所有项目数据离线汇总到数据中台中,形同统一的数据资源库,数据资产。为后续数据共享、数据挖掘分析提供数据支撑。
  3. 依托于数据中台升级改造业务生产系统,未来升级改造后的业务系统,直接与数据中台互通,并支持多租户,兼顾灵活的可配的业务审批流,同时支持私有化部署等。满足公司后续saas化服务的输出能力。

图 65 某企业数字化转型项目

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据分析小兵

你的鼓励将是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值