【如何使用UMLS关系】UMLS的关系最全讲解

目录

1.综合介绍

2.使用案例

       "ui": "R162928707",关系id

      "groupId": "0",通常是用于对特定的一组关系或实体进行分组的标识符。

      "attributeCount": 0,表示特定实体或关系所具有的属性数量。

      "classType",例如: ConceptRelation, AtomClusterRelation, AtomRelation

  "relatedFromIdName": "Closed fracture of carpal bone",这是关系的起始端概念名称,即 “腕骨闭合性骨折”。

      "relationLabel",例如:"PAR"

      "additionalRelationLabel",例如: "inverse_isa",(  relation attribute ),对关系的补充说明标签,这里是54中语义关系展示的语义树

      "relatedIdName": 是关系的目标端概念名称

3.参考资料


1.综合介绍

NLM于1986年开始了UMLS(Unified Medical Language Systems:一体化医学语言系统)的研究与应用,其目的是实现跨语言和跨数据库的情报检索。UMLS由四部分组成:超级叙词表、语义网络、情报源图谱和专家词典。超级叙词表是UMLS的核心部分,它收录了生物医学领域60多种词表和分类表中的语词,对于这些来源各异的语词,超级叙词表保留了它们在原来叙词表中的意义、关系等,并以概念为中心对超级叙词表进行组织。

       对于同一概念的不同术语以及不同的变异形式,超级叙词表采用三级结构模式,即概念(Ⅰ级)?术语(Ⅱ级)?词串?(Ⅲ级),将一个概念的多种不同术语连同多个变异词串有序地组织在一起。

【对应:  "classType",例如: ConceptRelation, AtomClusterRelation, AtomRelation】

并且,超级叙词表中还定义了11种概念间的关系来识别不同概念之间的联系。如广域关系(RB)、狭域关系(RN)、其他关系(RO)、相似关系(RL)、来源中的同义关系(SY)、非特异性的来源相关关系(RQ)、上位关系(PAR)、下位关系(CHD)、同位关系(SIB)、允许限制关系(AQ)和受限关系(QB)。

UMLS的语义是由语义类型语义关系两部分组成。2003AA版的语义网络设置了135种语义类型,为超级叙词表中的每一个概念分配最为专指的语义类型,并设置了54种语义关系来表达这135种语义类型之间的关系。这些语义关系除了最基本的等级关系【is_a】外,还有空间关系、物理相关关系、功能相关关系、时间相关关系和概念相关关系共六大类

        UMLS已被广泛应用于信息系统的智能化检索、自然语言系统研究、专业词表的编制、自动标引、医学专业搜索引擎的开发、医学图像的描述及获取、课程分析等方面。但是,对语义的应用开发还不充分,UMLS语义将需要进一步开发和利用。

美国国家医学图书馆(The National Library of Medicine,NLM)研制的医学文献分析与检索系统(MEDLARS)是目前世界上最大的医学文献检索系统。系统初期是利用叙词表揭示语义关系,但是对概念间关系揭示并不充分。
(一)         Conceptual Entity(概念性实体)  
 
Conceptual Entity(概念性实体) 
      Idea or Concept(想法或概念) 
             Functional Concept(功能性概念) 
                             Body System(身体系统) 
             Temporal Concept(时间概念) 
             Qualitative Concept(定性概念) 
             Quantitative Concept(定量概念) 
             Spatial Concept(空间概念) 
                             Molecular Sequence(分子序列) 
                                         Amino Acid Sequence(氨基酸序列) 
                                         Carbohydrate Sequence(碳水化合物序列) 
                                         Nucleotide Sequence(核酸序列) 
                             Body Location or Region(身体部位或区域) 
                             Body Space or Junction(身体间隙或连接) 
                             Geographic Area(地理区域) 
     Organism Attribute(有机系统属性) 
      Findings(发现) 
             Laboratory or Test Results(实验室或检验结果) 
             Sign or Symptom(体征或症状) 
      Intellectual Product(智能产品) 
             Classification(分类) 
             Regulation or Law(法规或法律) 
      Language(语言) 
      Occupation or Discipline(职业或专业) 
             Biomedical Occupation or Discipline(生物医学职业或专业) 
      Organization(组织结构) 
             Health Care Related Organization(保健相关团体) 
             Professional Society(职业团体) 
             Self Help or Relief Organization(自助组织) 
      Group Attribute(组团属性) 
      Group(组) 
             Age Group(年龄组) 
             Family Group(家庭组) 
             Professional or Occupational Group(职业组) 
             Population Group(人群组) 
             Patient or Disabled Group(病残组) 
 
 
(二)       Semantic Type – Event(语义类型-事件)
 
  Phenomenon or Process(现象与过程)
     Human-caused Phenomenon or Process(人为现象与过程) 
                 Environmental Effects of Humans(人类环境影响) 
     Injury or Poisoning(损伤或中毒) 
     Natural Phenomenon or Process(自然现象或过程) 
                 Biological Function(生物学功能) 
                             Physiologic Function(生理功能) 
                                         Cell Function(细胞功能) 
                                         Molecular Function(分子功能) 
                                                  Genetic Function(遗传功能) 
                                         Organ or Tissue Function(器官或组织功能) 
                                         Organism Function(有机体功能) 
                                                  Mental Function(意识功能)
                             Pathologic Function(病理功能) 
                                         Cell or Molecular Dysfunction(细胞或分子功能紊乱) 
                                         Experimental Model of Disease(疾病的实验模型) 
                                         Disease or Syndrome(疾病与症状) 
                                                  Mental or Behavior Dysfunction(意识或行为紊乱) 
  Activity(活动) 
     Behavior(行为) 
                Social Behavior(社会行为) 
                Individual Behavior(个人行为) 
     Daily or Recreational Activity(日常或娱乐活动) 
     Occupational Activity(职业活动) 
                Educational Activity(教育活动) 
                Government or Regulatory Activity(政府或管理活动) 
                Health Care Activity(保健活动) 
                            Laboratory Procedure(实验室步骤) 
                            Diagnostic Procedure(诊断步骤) 
                            Preventative or Therapeutic Procedure(预防和治疗步骤)
     Research Activity(研究活动) 
                Molecular Biology Research Technique(分子生物学研究技术) 
     Machine Activity(机器活动)
 
 
(三)Physical Object(物理对象)
 
Physical Object(物理对象)
    (1)Anatomic Structure(解剖学结构)
           Anatomic Abnormality(解剖学异常)
                       Acquired Abnormality(获得性异常)
                       Congenital Abnormality(先天性异常)
           Embryonic Structure(胚胎结构)
           Fully Formed Anatomic Structure(充分发育解剖学结构)
                       Body Part, Organ, or Organ Component (身体部分,器官,或器官成分)
                       Cell(细胞) 
                       Cell Component(细胞成分) 
                       Tissue(组织) 
                       Gene or Genome(基因或基因组) 
    (2)Manufactured Object(人工对象) 
           Medical Device(医学设备) 
           Research Device(研究设备) 
    (3)Organism(有机体) 
           Animal(动物) 
                       Invertebrate(非脊椎动物) 
                       Vertebrate(脊椎动物) 
                                   Amphibian(两栖动物) 
                                   Reptile(爬行动物) 
                                   Bird(鸟) 
                                   Fish(鱼) 
                                   Mammal(哺乳动物) 
                                                Human(人类)
          Bacterium(细菌) 
          Fungus(霉菌类) 
          Plant(植物) 
                        Alga(藻类) 
          Virus(病毒) 
          Rickettsia or Chlamydia(立克次体或衣原体) 
    (4)Substance(物质) 
          Body Substance(体物质) 
          Food(食物) 
          Chemical(化学物质) 
                        Chemical Viewed Functionally(功能分类化学物质) 
                                      Biologically Active Substance(生物活性物质) 
                                                Neuroreactive Substance or Biogenic Amine(神经反应物质或生物胺) 
                                                Hormone(激素) 
                                                Enzyme(酶) 
                                                Vitamin(维生素) 
                                                Prostaglandin(前列腺素) 
                                                Immunologic Factors(免疫因子) 
                                        Biomedical or Dental Material(生物医学或牙科物质) 
                                        Pharmacologic Substance(药理性物质) 
                                        Indicator or Reagent(指示剂或反应剂) 
                                        Hazardous or Poisonous Substance(有害性或毒性物质) 
                          Chemical Viewed Structurally(结构分类化学物质) 
                                        Inorganic Chemical(无机化学物质) 
                                                  Element or Ion(元素或离子) 
                                                   Isotope(同位素) 
                                                   Inorganic Compound(无机化合物) 
                                       Organic Chemical(有机化学物质) 
                                                   Alkaloid(生物硷) 
                                                   Amino Acid, Peptide or Protein(氨基酸,多肽或蛋白质) 
                                                   Carbohydrate(碳水化合物) 
                                                   Eicosanoid(二十(烷)类) 
                                                   Lactam(内酰胺) 
                                                   Lipid(脂类) 
                                                   Nucleic Acid, Nucleotide or Nucleoside(核酸,核苷酸或核苷) 
                                                   Steroid(类固醇) 
                                                   Organophosphorus Compound(有机磷化合物) 
 
 
 (四)Semantic Relations Branch(语义关系树)
 
语义关系 (54种)
1)ISA(是一个)
2)与…有关(Associated with)
    (1)物理有关(Physically related to)
            与…连接(connected to)
            由…组成(consists of)
            包含(contains)
            相互连接(interconnects)
            是…一部分(part of)
    (2)空间相关(Spatially related to)
            横断关系(traverses)
            比邻于(adjacent to)
            位于(location of)
            包围(surrounds)
    (3)功能相关(Functionally related to)
            影响(Affects)
                   管理(manages)
                   处理(treats)
                   使…紊乱(disrupts)
                   使复杂(complicates)
                    与…相互作用(interacts with)
                   预防(prevents)
           导致(Brings about)
                   产生(Produces)
                   引起(Causes)
            执行(Performs)
                   实行(carries out)
                   显示(exhibits)
                   实现(practices)
            发生于(Occurs in)
                   是…过程(process of)
              应用(Uses)
            是…的表现(Manifestation of)
              提示(Indicates)
            是…结果(Result of)
    (4)时间相关(Temporally related to)
            与…同时发生(co-occurs with)
            在…之先(precedes)
    (5)概念相关性(Conceptually related to)
            估计…的影响(assesses affect of)
            是…的概念性部分(conceptual part of)
            ……的价值为(evaluation of)
            ……的程度为(degree of)
            ……的测值为(measurement of)
            测量(measures)
            诊断(diagnoses)
            ……特性为(property of)
            ……的派生物(derivative of)
            ……的发育形式(developmental form of)
            ……的方法为(method of)
            造成(issue in)    

2.使用案例

当我们通过api查询关系后,常见的几个访问字段如下,搞清楚这些字段的意义对后续使用十分重要,给出一个案例如下:

GET/content/{version}/CUI/{CUI}/relationsRetrieves NLM-asserted relationships for a known CUI
{
  "result": [
    {
      "ui": "R162928707",
      "groupId": "0",
      "attributeCount": 0,
      "classType": "AtomClusterRelation",
      "relatedFromIdName": "Closed fracture of carpal bone",
      "relationLabel": "PAR",
      "additionalRelationLabel": "inverse_isa",
      "relatedIdName": "Closed fracture of left wrist"
    },
    {
      "ui": "R162926601",
      "groupId": "0",
      "attributeCount": 0,
      "classType": "AtomClusterRelation",
      "relatedFromIdName": "Closed fracture of carpal bone",
      "relationLabel": "PAR",
      "additionalRelationLabel": "inverse_isa",
      "relatedIdName": "Closed fracture of right wrist"
    },
    {
      "ui": "R143885131",
      "groupId": "NONE",
      "attributeCount": 6,
      "classType": "AtomClusterRelation",
      "relatedFromIdName": "Closed fractures of carpal bones",
      "relationLabel": "RO",
      "additionalRelationLabel": "member_of",
      "relatedIdName": "Osteoporosis/osteopenia (SMQ)"(骨质疏松症/骨质减少(SMQ))
    },
    {
      "ui": "R143946612",
      "groupId": "NONE",
      "attributeCount": 6,
      "classType": "AtomClusterRelation",
      "relatedFromIdName": "Fracturas cerradas de huesos del carpo",(闭合性腕骨骨折)
      "relationLabel": "RO",
      "additionalRelationLabel": "member_of",
      "relatedIdName": "Osteoporosis/osteopenia (SMQ)"
    } ...
  ]
}

 
      "ui": "R162928707",关系id


      "groupId": "0",通常是用于对特定的一组关系或实体进行分组的标识符。

作用可能是为了方便管理和组织大量的关系数据。通过分组,可以将具有某些共同特征或属于同一主题领域的关系归为一类。例如,可能将所有与特定疾病类别相关的关系分配到一个特定的 “groupId” 中,以便在检索和分析时能够快速定位和处理特定组别的数据。

      "attributeCount": 0,表示特定实体或关系所具有的属性数量。

属性可以是对实体或关系的进一步描述或限定信息。例如,对于一个医学概念,属性可能包括该概念的定义、同义词、所属分类等。如果 “attributeCount” 为 0,则表示该特定的关系或实体目前没有附加的属性定义。如果有具体的数值,就说明有相应数量的属性可以进一步提供关于该关系或实体的详细信息。


      "classType",例如: ConceptRelation, AtomClusterRelation, AtomRelation

在统一医学语言系统(UMLS)中,通过概念唯一标识符(CUI)检索关系时,选择不同的 “classType” 有以下区别:

一、ConceptRelation(概念关系)

  1. 范围:涉及更广泛的医学概念之间的关系。它涵盖了不同层次和领域的医学概念,从疾病、症状、诊断方法到治疗手段等各种概念类型之间的关联。
  2. 粒度:通常具有较粗的粒度,关注的是宏观层面上概念之间的逻辑联系。例如,一种特定疾病与一类治疗药物之间的关系可能被归类为 ConceptRelation。
  3. 用途:适合用于进行大规模的医学知识图谱构建、医学信息检索的高级筛选等。当你希望了解不同医学领域的主要概念之间的关系时,这个类型很有帮助。

二、AtomClusterRelation(原子簇关系)

  1. 范围:聚焦于由多个相关原子(最基本的医学术语单元)组成的原子簇之间的关系。原子簇可以是围绕特定主题或疾病领域的一组相关术语集合
  2. 粒度:相对较细,因为它涉及到具体的术语集合之间的关系。例如,关于心血管疾病的一组原子簇与关于呼吸系统疾病的一组原子簇之间的关系。
  3. 用途:对于深入研究特定医学领域内的术语关联、进行专题性的医学信息分析和挖掘非常有用。可以帮助研究者更好地理解特定领域内术语的组织结构和相互关系。

三、AtomRelation(原子关系)

  1. 范围:最为具体,仅限于单个医学术语单元(原子)之间的关系。这些原子通常是最基本的医学词汇或术语。
  2. 粒度:最细粒度的关系类型。例如,两个非常具体的医学术语,如 “高血压” 和 “血压升高” 之间的细微语义关系可能被归类为 AtomRelation。
  3. 用途:在进行精确的医学术语分析、语义理解和自然语言处理任务中非常关键。可以帮助提高医学文本处理的准确性和精细度,例如在医学文献自动标注、医学信息抽取等任务中。


  "relatedFromIdName": "Closed fracture of carpal bone",这是关系的起始端概念名称,即 “腕骨闭合性骨折”。


      "relationLabel",例如:"PAR"

        超级叙词表中还定义了11种概念间的关系来识别不同概念之间的联系。如广域关系(RB)、狭域关系(RN)、其他关系(RO)、相似关系(RL)、来源中的同义关系(SY)、非特异性的来源相关关系(RQ)、上位关系(PAR)、下位关系(CHD)、同位关系(SIB)、允许限制关系(AQ)和受限关系(QB)。


      "additionalRelationLabel",例如: "inverse_isa",(  relation attribute ),对关系的补充说明标签,这里是54中语义关系展示的语义树

(太多了,这里只展示一部分,具体可通过上述链接查询,统计后发现有1024种)


      "relatedIdName": 是关系的目标端概念名称

从总体返回结果看,154种概念对应的语义分类并没有给出,也许在关系查询时,这部分并不重要,语义网络中的54种关系类型,以及超级叙词表中的11种概念隐含关系才是我们在处理关系返回结果时需要关注的部分。

 

       

3.参考资料

科学网—UMLS的语义关系(综述) - 许培扬的博文

Abbreviations Used in Data Elements - 2024AA

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值