医学知识图谱构建技术与研究进展

本文概述了医学知识图谱在智慧医疗中的核心地位,探讨了知识表示、抽取、融合、推理及质量评估的关键技术,强调了自动化抽取实体、关系和属性的挑战,以及知识融合和推理在提升医疗服务效率和准确性上的作用。同时,文章指出医学知识图谱在信息检索、问答系统和决策支持系统的应用,并对未来的研究挑战和趋势进行了展望。
摘要由CSDN通过智能技术生成

640?wx_fmt=png&wxfrom=5&wx_lazy=1

来源: 人机与认知实验室

概要:医学知识图谱是实现智慧医疗的基石,有望带来更高效精准的医疗服务。

 

大纲

 

知识自动提取技术 

 

医学知识融合

 医学知识推理 



摘要:医学知识图谱是实现智慧医疗的基石,有望带来更高效精准的医疗服务。然而,现有知识图 谱构建技术在医学领域中普遍存在效率低,限制多,拓展性差等问题。针对医疗数据跨语种,专业性强,结构复杂等特点,对构建医学知识图谱的关键技术进行了自底向上的全面解析,涵盖了医学知识表示、抽取、融合和推理以及质量评估五部分内容。此外,还介绍了医学知识图谱在信息检索、知识问答、智能诊断等医疗服务中的应用现状。最后,结合当前医学知 识图谱构建技术面临的重大挑战和关键问题,对其发展前景进行了展望。


关键词:知识图谱;知识获取;知识融合;知识推理;自然语言处理


引言 


自 1998 年万维网之父 Tim Berners-Lee 提出语义网,人们不断在网络等电子载体上表达和修正对客观世界的理解,形成 了一个概念标准化的过程,同时随着链接开放数据 (Linked Open Data)的规模激增,互联网上散落了越来越多的知识元数据。


知识图谱就是在这样的大数据背景下产生的一种知识表示和管理的方式,强调语义检索能力。近年来,在人工智能的蓬勃发展下,知识图谱涉及到的知识抽取、表示、融合、推理、问答等关键问题得到一定程度的解决和突破,知识图谱成为知识服务领域的一个新热点,受到国内外学者和工业界广泛关注。


知识图谱的前身是语义网,它吸收了语义网、本体在知识组织和表达方面的理念,使得知识更易于在计算机之间和计算机与人之间交换、流通和加工。具体来说,一个知识图谱由模式图、数据图及两者之间的关系组成:模式图对人类知识领域的概念层面进行描述,强调概念及概念关系的形式化表达,模 式图中节点是概念实体,边是概念间的语义关系,如 part-of;数据图对物理世界层面进行描述,强调一系列客观事实。数据图中的节点有两类,一是模式图中的概念实体,二是描述性字符串,数据图中的边是具体事实的语义描述;模式图和数据图之间的关系指数据图的实例与模式图的概念之间的对应,或者说模式图是数据图的模具。


    著名的通用知识图谱中有,谷歌“Knowledge Graph”、搜狗“知立方”、YAGO、DBpedia等,它们具有规模大、领域宽,包含大量常识等特点。目前,医学是知识图谱应用最 广的垂直领域之一,如上海曙光医院构建的中医药知识图谱、本体医疗知识库 SNOMED-CT,IBM Watson Health等应用近两年也开始进入人们视线。 


    知识图谱是智能大数据的前沿研究问题,它以独有的技术优势顺应了信息化时代的发展,比如渐增式的数据模式设计;良好的数据集成;现有 RDF、OWL等标准支持;语义搜索和知识推理能力等。在医学领域,随着区域卫生信息化及医疗信息系统的发展,积累了海量的医学数据。如何从这些数据中提炼信息,并加以管理、共享及应用,是推进医学智能化的关键问题,是医学知识检索、临床诊断、医疗质量管理、电子病历 及健康档案智能化处理的基础。 
 

   本文首先介绍了医学知识图谱的构建技术,主要涉及到医学知识表示;医学知识抽取,包括实体、关系、属性的抽取;医学知识融合;医学知识推理和质量评估五个部分。然后介绍了基于医学知识图谱的包括检索、问答、决策等的应用现状。最后对医学知识图谱的研究、应用重点,面临的挑战以及未来 的发展趋势进行了展望。 


1 医学知识图谱构建 


    本文将医学知识图谱构建技术归纳为五部分,即医学知识的表示、抽取、融合、推理以及质量评估。通过从大量的结构化或非结构化的医学数据中提取出实体、关系、属性等知识图谱的组成元素,选择合理高效的方式存入知识库。医学知识融合对医学知识库内容进行消歧和链接,增强知识库内部的逻辑性和表达能力,并通过人工或自动的方式为医学知识图谱更新旧知识或补充新知识。借助知识推理,推出缺失事实,自动完成疾病诊断与治疗。质量评估则是保障数据的重要手段,提高医学知识图谱的可信度和准确度。


1.1 医学知识表示 


知识表示是为描述世界所做的一组约定,是知识符号化、 形式化、模式化的过程,主要研究计算机存储知识的方法, 其表示方式影响系统的知识获取、存储及运用的效率。然而医学数据种类繁杂,存储方式不一,电子病历格式和标准不同,经常涉及交叉领域等特点,导致医学领域与其他领域在知识表示方面有所差异,同时也给医学领域的知识表示带来极大的挑战。


    早期医疗知识库运用的知识表示方法有:谓词逻辑表示法,产生式表示法,框架表示法,语义网表示法等等。比如, SNOMED-CT,早期的 MYCIN 系统,大肠杆菌数据库 EcoCyc等。随着知识图谱中知识增长、关系复杂化,这些方法由于表示能力有限且缺乏灵活性,不再作为主要的知识表示方法,更多是作为医学知识表示的辅助或补充。


    本体表示法以网络的形式表示知识,即以(实体 1,关系, 实体 2)三元组来表示相关联的两个节点(实体),在知识图谱提出之

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值