[论文阅读笔记69]医学术语标准化-CODER

最新推荐文章于 2024-06-19 14:53:39 发布

happyprince

最新推荐文章于 2024-06-19 14:53:39 发布

阅读量1.4k

点赞数

分类专栏： NLP 文章标签：人工智能机器学习算法

本文链接：https://blog.csdn.net/ld326/article/details/126404176

版权

NLP 专栏收录该内容

79 篇文章

订阅专栏

1. 题目

CODER: Knowledge infused cross-lingual medical term embedding for term normalization
Zheng Yuan团队
CODER: contrastive learning on knowledge graphs for cross-lingual medical term reprensentation.
跨语言医学术语表示的知识图对比学习

2. 贡献

提出了KG的对比训练模型；
对现有医疗嵌入进行评估。zero-shot术语标准化、医学概念相似性度量和概念关系分类任务中实现了最先进的结果（ state-of-the-art）；
CODER是第一个跨语言的医学术语表示，支持英语、捷克语、法语、德语、意大利语，日语、葡萄牙语、俄语、西班牙语、荷兰语和汉语。

3. 方法

定义基于嵌入的术语规范化任务以及如何嵌入术语；然后引入KG对比学习进行项归一化。

提出了对kg的两术语和关系三元组的对偶对比学习。
术语关系项相似度是术语关系(ℎ，r)和术语(t)之间的相似度。

3.1 基于嵌入术语正则化

即是把术语向量化，然后计算cos距离，选择最大的那个标准术语作为最后的结果；

3.2 术语表达

初始化PLM： PubMedBERT [17] ，mBERT [12]；

术语表示，方法1：采用[CLS]的向量来表示；

方法2：采用平均pooling来表示：

3.3 同义词的对比学习框架

正样本主要是来自图谱：term-term对；term-relation-term对；

label定义：

术语相似性定义：

参考

【1】githut:https://github.com/GanjinZero/CODER
【2】Zheng Yuan, Zhengyun Zhao, Haixia Sun, Jiao Li, Fei Wang, and Sheng Yu. 2021. CODER: Knowledge infused cross-lingual medical term embedding for term normalization. In Proceedings of ACM Conference (Conference’17).
ACM, New York, NY, USA, 11 pages.https://arxiv.org/pdf/2011.02947.pdf
【3】Fangyu Liu, Ehsan Shareghi, Zaiqiao Meng, Marco Basaldella, and Nigel Collier. 2020. Self-alignment Pre-training for Biomedical Entity Representations. arXiv
preprint arXiv:2010.11784 (2020).