本文转载自公众号:恒生技术之眼。
人工智能、大数据等前沿科技的爆发,推动金融科技进入了一个崭新的时代,也成为监管科技发展的重要推动力。在这个Fintech的黄金时代,前沿科技正在如何赋能监管?这方面,恒生公司首席架构师章乐焱带来了一场关于“大数据+知识图谱在RegTech的应用探索”分享:
变革时代,Regtech如何提档升级?
随着信息资源呈爆炸式增长,海量数据源源不断涌现,DT(Data Technology)时代已然开启。而金融业更是高度数字化的行业,背后沉淀了丰富的数据资源,包括舆情信息、新闻资讯、市场行情、经济数据、公司公告、财务数据等等,有巨大的价值挖掘空间。因此,对于DT时代的监管科技来说,深挖金融数据价值并赋能监管,是一个新的趋势。
为了更好地挖掘数据的价值,一方面需要将人工智能等前沿科技应用于数据处理,另一方面也需要更强的专业性。建立数据中台是提升专业性的一个重要方式,可以将原来分散在各个条线上的能力汇聚起来,进行技术上、业务上的专业能力沉淀以及专业分工,从而提升数据处理能力。
知识图谱能为Regtech做什么?
在DT时代,监管科技需要加强数据处理、数据价值挖掘能力,那么如何能做到这一点呢?
这就需要应用到大数据、知识图谱等技术。尤其知识图谱,能够对大数据做深度加工,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,从而在此基础上做更高效的计算。
用知识图谱的图数据库、图计算技术处理金融数据,很多事物都能用关系图来表示。例如,企业图谱以企业为中心,可以把围绕企业的种种关系建立起来,比如企业与企业的关系、企业与人的关系、企业与行业的关系、企业与舆情事件的关系、企业与宏观要素的关系等。
企业图谱中的关系网络可以按需逐级展开
产业链图谱所展示的则是行业结构和上下游关系,能够建立行业之间的传导逻辑,颗粒度细化到公司和产品,并且公司、行业之间能够相互映射、影响。此外,还能够形成宏观图谱、行业图谱、产品图谱等多种类的图谱。
医药产业链图谱
金融领域每天会产生大量动态的新闻、资讯,对资产价格有很大的影响。那么,当某个事件发生之后,会基于哪些事件传播逻辑对市场产生影响?金融领域的事件有哪些类型,哪些事件是值得深入分析的?这些都是需要事件图谱解决的问题。
通过引入动态事件、动态数据,恒生事件图谱能够提供从数据到业务的一套完整解决方案:在数据层面,能够整合多源异构数据源,建立产业金融大数据中心,构造产业金融知识图谱;在业务层面,可以基于静态知识图谱形成企业画像,基于动态数据进行舆情事件分析,根据事件基于知识图谱的影响传导进行企业深度分析。
恒生公司在知识图谱构建方面不断沉淀的同时,也在积极探索其赋能监管科技的方式,例如在舆情挖掘、风险识别等方面,知识图谱都能发挥较大的作用。
舆情挖掘与事件分析
金融监管对于舆情捕捉有很高的要求。基于人工智能的舆情挖掘与事件分析,不仅需要知识图谱技术,还需要用自然语言处理技术对舆情信息做一些分析,例如识别信息中涉及哪些实体,判断事件的类别、情感的正负面等等。处理好这些信息之后,再结合知识图谱技术分析哪些事件会顺着图谱链进行传导,捕捉舆情事件的风险传导路径,从而及时预警。
基于股权穿透的风险识别
一家公司向上有哪些股东,向下有哪些子公司、孙公司,是金融关系网中重要的关联关系。应用知识图谱技术可以实现股权穿透,逐层展示公司控股持股关系,帮助监管机构理清企业之间错综复杂的关系。例如,当一个P2P平台发生爆雷,监管机构可以根据企业股权链判断风险的传播路径和影响范围;再如,资本市场中有很多资本系,通过精准分析企业背后的股权结构,可以深度挖掘资本系成员,助力监管机构及时发现资本系中存在的问题。
当下,互联网已经迎来了下半场——产业互联网,To B将是未来发展的一个主要方向。在这个过程中,前沿金融科技将重构金融基础设施,带来一个金融行业的发展新时代,不仅可以让监管更智能,还将促进投研、投顾、量化等诸多领域的蝶变。
未来,恒生研究院也将不断探索大数据、知识图谱、自然语言处理等前沿技术的金融场景落地,输出数据处理等多方面的能力,以开放的姿态与行业共建金融新生态。
(本文整理自章乐焱在2019金融集团大数据及监管科技应用研讨会的演讲《大数据+知识图谱在RegTech的应用探索》)
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。