本文根据罗永秀先生在【DQMIS 2020第四届数据质量管理国际峰会】现场演讲内容整理而成。
图1.1
鸿翼联合创始人兼CTO 罗永秀
演讲嘉宾介绍 - 罗永秀
-
中国ECM(企业内容管理)资深专家。近20年来一直专注于ECM领域,推动ECM相关技术的演进和产业化应用,是中国ECM创新技术、实践应用和理论体系的集大成者。
-
作为总技术负责人,他主导鸿翼参与了贵州大数据平台、中国银联非结构化数据中心等数百个国家大数据项目;打造的构建于鸿翼强大的ECM底层平台和与各行业紧密结合的内容业务中台之上的解放方案服务了招商银行、上汽、扬子江药业等逾3000家企业。他还参与了工信部《DCMM数据管理能力成熟度评估模型》等多个国家标准的建设。
演讲目录
-
非结构化数据现状分析
-
非结构化数据管理体系
-
ECM内容管理国内外发展史
-
ECM内容管理全景产品介绍
-
非结构化数据应用解决方案
罗总:大家好!我是上海鸿翼软件技术股份有限公司的罗永秀,非常感谢主办方的邀请,今天能有机会把鸿翼近20年专注于ECM内容管理和非结构化数据领域的内容做一个完整的整理和分享。
今天我分享的主题是“基于ECM管理的非结构化数据管理体系与最佳实践”,我们先来看一下非结构化数据与结构化数据的比较。
图1.2
可以看到非结构化数据占有80%,其信息量是非常丰富多彩的,有描述性的、有情感描述的、有各种记录的,可以说数据价值的挖掘更多是要依靠这80%的非结构化数据。
比较于国际上,我们知道国内的非结构化数据的发展应该说是才刚开始。当前我们面临一系列的非结构化数据管理的问题,包括连接方面、业务融合方面、服务输出方面、获取利用方面、支撑架构方面、数据治理方面;还有,一直困扰着国内外非结构化数据的安全问题、合规问题、体系化建设问题等。
图1.3
数据当下,新基建里的大数据更多是非结构化数据;人工智能依赖于数据,更是依赖于非结构化数据;工业互联网产生了海量的非结构化数据;数据成为一种生产要素,数据从资源、资产再到资本,其中数据资产更是从非结构化数据开始。
图1.4
在国内,非结构化数据的重要性与其在认知、管理体系和平台建设的现状形成了一种剧烈反差。最近,与DAMA汪主席等业界同仁在沟通,大家都强烈意识到了这种反差。这种反差是:数据标准更多是从结构化视角去制定的标准,大数据建设更多是结构化大数据建设,首席数据官更是结构化数据的CDO,数据中台更多是结构化数据中台;但数据之80%是非结构化数据ÿ