从电子病历（EMRs）构建医学知识图谱

Debroon

已于 2024-04-13 12:36:37 修改

阅读量2.8k

点赞数 12

分类专栏： # 知识图谱RAG：精准可信文章标签：知识图谱人工智能

于 2024-04-13 12:04:03 首次发布

本文链接：https://blog.csdn.net/qq_41739364/article/details/137711661

版权

93 篇文章

订阅专栏

从电子病历 EMRs 构建医学知识图谱

提出背景
传统的三元组结构
本研究采用的四元组结构
第四元作用
第四元类型
以往的方法
本研究的方法

大威天龙·八

论文：Real-world data medical knowledge graph: construction and applications

本研究在中国一家三甲医院的大数据平台上进行，构建的医学知识图谱包含9种实体类型，共22,508个实体，并建立了579,094个四元组结构以代替传统的三元组结构。

在本研究中，通过使用中国一家三甲医院的大数据平台，我们构建了一个复杂的医学知识图谱，这个图谱不仅包含多种医学实体类型，还采用了四元组结构代替了传统的三元组结构，以提供更丰富的信息和关系表示。

在传统的知识图谱中，糖尿病和相关实体之间的关系通常用三元组表示，例如：

这些三元组有效地表示了实体之间的二元关系。

四元组结构在三元组的基础上增加了额外的维度，可以提供更多的上下文或属性信息，使得关系描述更加详细和精确。

对于糖尿病，四元组的例子可能包括：

在这些四元组中，第四元素提供了关于关系的额外信息，如症状出现的频率或治疗的具体适应症。

这不仅帮助医生更好地理解疾病的具体表现，也能针对不同类型的糖尿病提供更加个性化的治疗建议。

通过扩展传统知识图谱的结构和利用大规模数据，显著提升了医学知识图谱在处理复杂疾病如糖尿病时的细致度和实用性。

(糖尿病, 关联症状, 视网膜病变, 频率: 常见)
- 这个四元组说明视网膜病变是糖尿病的一个常见症状。
(糖尿病, 推荐治疗, 代谢手术, 适应症: 2型糖尿病且药物治疗无效)
- 这表示代谢手术是针对那些2型糖尿病患者的推荐治疗方案，尤其是在药物治疗无效的情况下。
(糖尿病, 预防措施, 定期体检, 频率: 每年)
- 这个四元组建议所有糖尿病患者每年进行定期体检，以早期发现可能的并发症。
(糖尿病, 饮食建议, 低糖饮食, 适应症: 所有类型)
- 这表示对于所有类型的糖尿病患者，推荐采取低糖饮食。

当诊断出患者有2型糖尿病且传统药物治疗效果不佳时，医生可以考虑推荐代谢手术。

对于初诊的糖尿病患者，医生可以强调定期体检的重要性，特别是检查可能的视网膜病变。

在日常管理中，医生会向所有糖尿病患者推荐低糖饮食，并根据患者的具体病情调整饮食建议。

在这里插入图片描述

图显示了知识图谱中用来表示事实的四元组结构。

在这个例子中，四元组由以下部分构成：

主体（Subject）：Type 2 diabetes mellitus（2型糖尿病）
谓词（Predicate）：disease_related_symptom（疾病相关症状）
宾语（Object）：Polydipsia（多饮）
属性（Properties）：包含四个属性，数量（num）、概率（probability）、特异性（specificity）和可靠性（reliability），每个属性都有其数值。

这个结构扩展了传统的三元组（SPO）结构，提供了有关特定疾病症状关系的更多详细信息，如多饮作为2型糖尿病的常见症状。

在四元组知识表示中，第四元通常是用来添加关于关系的额外信息，增加上下文或详细说明的。

这第四元可以是多种形式，具体取决于所要表达的信息和应用场景：