omaha图谱调研评测

图谱基本数据

  • 基于开放的医学知识资源,利用自然语言处理、文本挖掘技术与人工审核相结合的方式构建的临床诊疗相关知识图谱
  • omaha的图谱测试集构建按照可能性原则构建,测评时也按照这个准则
  • SCHEMA:https://schema.omaha.org.cn/class/Thing

测评内容:

目录:

  • 定性报告
    • 完整性
    • 准确性
    • 唯一性
  • 定量报告
    • 完整性
    • 准确性
      • 实体准确度
      • 下位词接口
      • 同义词接口
    • 唯一性
    • 一致性

定性报告

完整性

药品,疾病,解剖结构完整度可,仍需补充,检查,检验,手术,科室,及虚拟词如限定词等需大大补充。

准确性

 omaha原始实体准确率很高(非100%),但schema太宽泛,可用性低.
人工调整后引入准确度问题
普遍存在且影响使用的有:

     1. 异常发现与疾病标准 混淆
     2. 检验与非手术治疗 混淆

唯一性

omaha本身,唯一性存在问题,需要做同义词合并的工作。

定量报告

完整性

测评一:基本信息

节点类型: 63

{核苷酸位点': 239425, '基因突变': 125476, '疾病': 120833, '解剖结构': 104548, '核苷酸改变': 77598, '氨基酸改变': 70048, '医疗设备': 53156, '异常发现': 33025, '基因': 28724, '手术': 28326, '药品': 27944, '观测操作': 27095, '物质': 22406, '生物': 20358, '操作': 19104, '异常形态结构': 4829, '转录本编码': 3746, '检查': 3399, '分子活性': 3301, '组织机构': 3123, '基因位点': 3098, '生物过程': 2470, '可观察主体': 2464, '药物治疗方案': 1477, '临床路径': 1235, '正常发现': 907, '操作治疗方案': 844, '技术': 834, '事件': 593, '评估标准': 562, '操作方法': 524, '药物剂型': 441, '时间': 346, '空间概念': 329, '用药途径': 232, '评价结果': 195, '检验': 163, '单位': 152, '非手术治疗': 108, '物理能量': 89, '标本': 85, '物理实体': 82, '人群': 79, '量纲类型': 70, '体位': 29, '严重程度': 28, '病理过程': 18, '操作方式': 13, '临床科室': 8, '身体状态': 7, '诊断方案': 6, '用药目的': 6, '治疗阶段': 5, '限定词': 5, '精度类型': 5, '基因组': 4, '饮食类型': 3, '就诊类型': 3, 'OMAHA医学术语': 1, '批准文号': 1, '数值': 1, '药品本位码编码': 1}

关系类型 :123

{'子类': 1072643, '所在基因组': 249827, '突变核苷酸位点': 249191, '核苷酸改变': 125200, '转录本编码': 125200, '突变基因': 120915, '适应证': 113747, '氨基酸改变': 90268, '有效成分': 86489, '基因表达部位': 79225, '发生部位': 69126, '是…组成部分': 54283, '形态学改变': 51862, '科室': 44688, '临床表现': 43023, '相关检查': 26595, '方位': 25467, '剂型': 24139, '基因位点': 23693, '用药目的': 22353, '致病原因': 21338, '治疗方式': 19997, '细胞定位': 18008, '病理过程': 14238, '症状': 12422, '住院/门诊期间必需检查': 10633, '发生于…期间': 10139, '操作部位': 9783, '诊断依据': 9604, '评价对象': 7825, '治疗前必需检查': 7534, '是…的分支': 7035, '给药途径': 6821, '诊断相关检查': 6142, '入路': 6134, '治疗药物': 5931, '分子活性': 5813, '参与过程': 5688, '住院/门诊期间备选检查': 4767, '操作方法': 4690, '体征': 4518, '使用技术': 4367, '选择用药': 3872, '评价结果': 3839, '临床过程': 3139, '受检标本': 2747, '治疗前备选检查': 2376, '治疗方案': 2344, '与…鉴别诊断': 2294, '治疗后必需检查': 1950, '治疗相关检查': 1948, '受检成分': 1822, '适用对象': 1645, '实验室检查': 1325, '并发症': 1279, '术后用药': 1267, '就诊类型': 1235, '麻醉方式': 1066, '适用人群': 1062, '术中用药': 1009, '使用的器械': 909, '治疗后备选检查': 868, '辅助检查': 716, '操作形态学改变': 668, '植介入器械': 659, '分型': 630, '危险因素': 593, '治疗后复查': 448, '入院/门诊后必需复查': 348, '禁忌证': 309, '住院/门诊期间相关检查': 309, '精度类型': 290, '不良反应': 282, '术前用药': 191, '治疗前检查': 178, '随访复查': 175, '使用的能量': 174, '术中操作': 158, '常伴发…': 143, '药物成分': 137, '体格检查': 90, '指标': 89, '预防用药': 88, '入院/门诊后备选复查': 72, '病情监测': 61, '常见症状': 58, '目标物质': 57, '受检时长': 49, '用药相关检查': 48, '入院/门诊后复查': 42, '治疗阶段': 34, '二级预防': 33, '发展为…': 32, '预防性抗菌药物': 29, '操作前检查': 25, '常见体征': 21, '使用的通路器械': 19, '护理操作': 18, '一级预防': 15, '一线用药': 14, '少见症状': 13, '二线用药': 13, '分期': 12, '一般治疗': 10, '少见体征': 7, '诊断标准': 6, '免疫治疗': 6, '严重程度': 6, '辅助性物质': 6, '灭活物质': 5, '后遗症': 5, '抗病毒治疗': 5, '康复治疗': 4, '治疗器械': 3, '操作后饮食类型': 3, '血清学检查': 2, '操作条件': 2, '病原学检查': 2, '护理方案': 1, '禁忌药物': 1, '三线用药': 1, '后发于': 1, '一线治疗': 1}

属性 5
['identifier', 'code', 'name', 'alias', 'increment', 'updateTime', 'source']

节点数量: 1033987
关系数量:2946774
定义:

核心实体
疾病' ,'异常发现','手术','药品','检查', '检验'
关键实体
{'医疗设备', '人群', '操作方式', '疾病', '单位', '解剖结构', '异常发现', '正常发现', '手术', '严重程度', '用药途径', '药物剂型', '评估标准', '药品', '科室', '可观察主体', '检查', '检验', '非手术性治疗','限定语',}
测评二 与国家标准及医院主数据类别数量及覆盖量对比
总量统计 /类别图谱数据国家标准数据
诊断120833+ 3302537290
手术2832612856
药品27944201932
检查3399
检验163

国家标准为ICD临床2.0,和药监局统一标识
主数据更新至2021年12月
诊断里面包含疾病,异常发现+ 正常发现 + 症状关系尾部实体 其他 需要予以区分
药品 schema 稍不一致

准确性

测评一 抽样测评各实体及关系内容可靠性
测评方案:
针对核心实体,采样大量实体(100条)检查准确度 
针对关键实体,采样少量实体(50条)检查准确度 
优点: 准确  缺点:需要大量人力
准确度= 正确的实体/采样实体个数
获取特定列实体接口的准确性
同义词查询准确性
下位词查询准确性
关系查询多跳查询准确性
测评二 验证其他图谱及标注内容是否和本图谱保持一致。
数据集准备:
CBLUE CUMLS SNOMED CT UMLS 医药卫生知识服务系统 中医药知识图谱
测评接口:
全部
测评三 医院数据推理验证其可靠性

数据集准备:
测评接口:
下位词查询准确性
关系查询多跳查询准确性

唯一性

各实体类别唯一性做的都不好

一致性

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值