ubuntu下ecm驱动_鸿翼罗永秀数据时代如何基于ECM进行电子文件管理

d28ea687dc6753a86a7cfa851a750dff.png

11月28日,以“数据管理深度融合下的电子文件管理”为主题的第十一届“中国电子文件管理论坛”在北京举行,由中国人民大学电子文件管理研究中心和鸿翼共同编写的《数据管理中的文件档案与内容管理白皮书(2020年)》在会议上正式对外发布。鸿翼联合创始人兼CTO罗永秀也受邀发表了《数据时代如何基于ECM进行电子文件管理》的主题演讲。

0864dd1a0cf05ca719db9c1fd07a73ac.png a9cea8d45811789e4b0c5022f37477a0.png

鸿翼联合创始人兼CTO 罗永秀

以下为演讲实录:

大家好!

今天跟各位分享的主题是《数据时代如何基于ECM进行电子文件管理》。

我从“鸿米”说起,“鸿米”是鸿翼的数字化转型系统,该系统把我们现实世界的产品、项目、客户、问题等所有内容全部数据化,通过中枢神经的数据驱动管理层、对现实世界各种业务做出实时调整和准确决策。在档案领域中,通过数据我们可以准确获知档案业务、档案运营和档案服务的具体情况;在工程现场拍张照片上传至非结构化数据平台,经过各种处理与分析后,能判断出该工程部件是否存在质量瑕疵。这就是数据的魅力,结构化数据的魅力。

结构化数据有很多显著特征,它是量化的,一是一,二是二,量化数字背后体现的是真实的现实世界;它是有规则的、有逻辑和可分析的。

其实“档案数据化”早在90年代就开始了,比如著录和元数据搜索,只不过属于浅层数据化。当前对于档案数据化和数据管理解读有三个主流维度:描述了一种宏观层面的社会变革趋势,其强调的是万物皆数据;描述了一种微观层面的组织变革趋势,将组织转化为数据驱动型组织;更普遍的认知是数据化代表着一种技术趋势,将电子文件转化为结构化的量化数据,然后去实现相关应用与管理。

8b17435b5d94dea1b1c7c1d8bdf59e1a.png

当前数据化三个主流角度解读

结构化数据与非结构化数据是互相转换的,互转一直伴随在各种应用场景中。比如:合同审批流程结束后,根据流程表单数据生成一份电子合同PDF文件,再将文件传给客户。为什么要这样呢?原因是比较于细颗粒度的结构化数据,电子文件具有更强的稳定性与不易篡改性,这是结构化数据转化为非结构化数据的典型应用场景。反之,我们将一份电子文件中客户名称、产品详情等信息进行提取和结构化,然后进行应用构建与数据分析,这是非结构化数据结构化,其目的是借助于结构化数据能力,对电子文件进行更好地开发和利用。

48c55bdae2fa99dbfae9bc8a82b3320b.png

非结构化与结构化数据之关系

当前电子文件面临着IT视角下、业务视角下、数据视角下和体系视角下的很多问题,如何更好应对这些问题?我觉得首先需要从技术层面进行整体规划,尤其对于中大型企业来说,需要首先建设分别代表着数据、智能与业务能力的三大基础平台,分别是非结构化数据中台、人工智能平台和内容低代码开发平台,然后在其上层构建起文件档案知识一体化系统,以满足业务支持和业务决策对电子文件的各方面要求。

96af42206ed8b32fab14ee949c5e80b0.png

需要怎样的电子文件管理平台

企业内容管理(Enterprise Content Management)在国际上已有20多年历史,是一种以电子文件为主体,具有全面业务融合和智能洞察能力的企业内容管理平台,也是一种聚焦于非结构化数据领域的应用软件类型。在国际上,文件管理、档案管理和非结构化数据中心都是基于有着完善技术体系的ECM平台构建而成。

从大颗粒度的电子文件到小颗粒度的结构化数据,中间需要“内容”,通过内容把大颗粒度的电子文件转化为小颗粒度且可分析的结构化数据;然后通过结构化数据的成熟技术体系,再对电子文件进行深度开发利用、知识服务和有效管控。

70d302ab62ab26bd790be9ad3a56a3a3.png

ECM内容管理能力模型

ECM企业内容管理应用全景是以底层ECM CORE为核心技术,形成了CSP内容服务平台、CSA内容业务平台和智能平台,并在平台上层构建起从内容协作、应用、安全、合规、管理、业务、治理、智能等不同行业领域的内容应用产品。

5f89a997e2b7973cb6802948731a648f.png

ECM内容管理应用全景图

接下来来我们看看当前电子文件存在的关键问题以及ECM企业内容管理可以如何应对?

第一:用户体验问题之ECM应对,现在的用户越来越“懒”,他们希望产品把用户体验做到极致,服务与应用要嵌入原有应用场景中,不改变原有操作习惯;还要求提供的内容服务是完整而精准的。这些问题需要ECM平台不仅能聚集企业文件档案等各种数据,还要支持分析处理能力,并通过各种端与应用服务,落到具体应用场景上。大平台和深处理的支撑,才能有用户的无感操作体验。

第二:大数据问题之ECM应对,如今,知识密集型企业或集团性大企业不仅面临海量的PB级别大规模存储、百亿文件量支持要求,还需要满足多组织、跨国等复杂系统架构,并需要通过内容服务总线技术采集和归档各种第三方系统中的核心业务文件,这些都是ECM CORE的基础关键能力,数据汇聚后还可以运用ECM CORE洞察能力进一步对数据进行价值挖掘。

第三:安全问题之ECM应对,从免遭越来越猖狂的勒索蠕虫病毒侵袭,到员工走了所有数据都在,到安全事故发生后有详细日志可追溯,再到不同应用场景下的安全防控体系建设,最后到对用户操作进行安全分析以实现安全可预测,这是企业的一般安全防控能力五阶梯,涉及到登录安全、访问安全、传输安全、数据摆渡、内容安全、存储安全、离线安全、安全分析等各种ECM安全技术支撑。

d3bf7e0f3edeca4bdae714d81b11f717.png

安全问题之ECM应对

第四:业务融合问题之ECM应对,通过ECM平台的连接汇聚能力、全接口开放、内容服务总线和内容业务构建能力等,可对文件档案的四类业务进行全面融合,包括一:电子文件本身业务,例如文件协同编辑、工程协同设计,二:以电子文件为主体的体系化应用,比如ISO质量体系管理、KM知识管理等,三:电子文件场景化应用,四:与OA、ERP等各种第三方业务系统集成。

97807b6141c377ceb537832fc41b76f4.png

业务融合之ECM应对

第五:AI赋能不足之ECM应对,基于ECM AI智能与Graph知识图谱双引擎,进行电子文件各种结构化以实现智能著录、智能归档、智能鉴定、智能检索等。知识图谱是人工智能的背后驱动力,数据源非常广,也可无限延展,从而可持续增强关联性和逻辑力,让数据发挥更大的智力。

5079c71f19486227ea67a57070643347.png

AI赋能不足之ECM应对

以上只是文件档案和非结构化数据管理中面临的一些关键问题,如何实现更好的数据质量、更深度的业务融合、更全面的知识利用呢?大家都知道,在结构化数据世界里,因为有底层的数据模型,才有了上层的丰富多彩的应用系统。因此,我觉得有一条思路,即构建一套类似于结构化数据模型的非结构化数据模型,即内容模型。

内容模型是现实世界(文件业务)非结构化数据特征的抽象,包括静态特征、动作行为和合规安全约束等,内容模型是业务价值链的实现框架与指引,是确保数据标准、数据质量、数据安全和元数据管理职能活动的高效开展。

不管是在业务端的内容库、文件夹,还是档案端的门类、分类、案卷等,实际上都对应着现实业务世界的某一种业务对象,该业务对象有自己特有的属性特征、关联关系、内容要求、多元元数据、子域规划、行为活动、权限体系、存储规则等,这就是内容模型。

328f8a97e61730dc91590cb623b350b4.png

内容模型

在内容模型框架下,电子文件数据可以在不同空间、不同时间,井然有序地流淌着,不仅数据质量可以得到确保,而且数据流转等活动都在统一策略下准确执行。

接下来,用一个工程应用场景进行以“内容模型”为核心的电子文件管理说明,步骤1:工程项目管理系统中立项成功后,在业务文件系统中直接生成对应的成套文件夹,并自动设置文件夹访问权限,自动构建起项目内容模型。步骤2:分析合同业务,构建形成包括合同名称规范、合同多维元数据、合同业务提醒、到期自主归档等在内的内容模型。步骤3:合同管理系统中新增合同后,按合同内容模型架构,直接保存至文件系统中,从而保证合同的实时归档和高质量入库;待到基于元数据的时间到期或规则满足时,合同模型自动发起归档,归档内容包括各种元数据和相关电子文件。步骤4:企业进一步构建统一数据中心或上层应用时,能方便基于各种业务对象内容模型,进行内容模型间或与其它结构化数据进行关联和分析。

cd252c405a5c0e287e429bf9cc6ff5f0.png

内容模型举例说明

内容模型从业务中抽象,是技术形式架构,是实现文件档案知识与业务一体化的关键,而ECM的核心基础正是内容模型。通过整个内容模型框架,电子文件相关策略、质量、效率、业务支持、安全合规等方面就有了切实可控的着力点。

bf0a3aac69276dc359286e6d44230fd0.png

内容模型驱动电子文件管理

数据时代,如何实现电子文件的数据化与数据管理,需要从数字化能力和内容开发利用程度两个维度进行矩阵规划。其中数字化能力维度分为:一、基础层的非结构化数据本身管理,包括集成整合、海量存储、备份容灾、数据安全等技术;二、上层的各种结构化能力,需要运用二维元数据、内容模型、内容解析、知识图谱、主体提取等各种结构化技术手段;三、再上层的知识化,其技术包含多维组织、用户编研、移动档案、档案知识问答、个性化推荐等;四、智能化,通过AI与Graph智能双引擎为应用效率提升赋能、让安全合规更可控。对于开发利用程度的维度,需要考虑内容组织、内容分析、内容挖掘等。

借助于ECM平台能力让电子文件、内容和结构化数据进行相互转化,从而实现对电子文件的深度开发与充分利用。在国内,虽然ECM已经得到全行业的一定认知,但认知度还是非常不够。数据管理框架下,我们更需要借助ECM内容模型对电子文件进行全程管理和挖掘利用。立足于非结构化数据领域的ECM,可加速推进电子文件数据化进程,助力电子文件数据管理能力全面升级。

我们都说从数字化到数据化,其实我想说从数据化再到“数字化”。把现实世界数据化,这只是数字化转型和升级的前半程,真正提升生产力的是后半程,即对数据经过处理分析后,再回至现实世界,对现实世界的各种生产经营和管理活动进行决策、调优和创新。

4c6807f3fad62c0e704156155313095e.png 929247eb0c71ad6a64bd81018d6d3e6f.png

点击

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值