自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 【保姆级教程】UMLS工具——MetaMap安装及使用

SPECIALIST 词典是一个大型的和词典,旨在提供 SPECIALIST 自然语言处理系统 (NLP) 所需的信息,其中包括 MetaMap 和词汇工具等。它旨在成为包含许多生物医学术语的通用英语词典。涵盖范围包括来自各种来源的常用英语单词和生物医学词汇。这每个词汇项目(单词或术语)的词典条目记录了 SPECIALIST NLP 系统所需的句法、形态(词形变化和派生)和正字法(拼写变体)信息。

2024-09-29 22:27:35 411

原创 UMLS的api调用(Postman)

然后就能用了,但是我得批量处理,所以我得程序调用,接下来研究怎么用程序批量处理数据来调用api。导入和会看到各种链接,随机点开一个,会发现,运行示例需要 UMLS API 密钥。保存上面链接的 UMLS API 示例文件。然后将文件导入 Postman。postman导入,使用粘贴板导入链接。来与这些示例进行交互。

2024-09-29 19:09:18 244

原创 【2006.07】UMLS工具——MetaMap原理深度解析

映射的。

2024-09-29 14:48:05 986

原创 【2024】LARK-通过知识图谱增强大模型复杂逻辑推理

作者为来自弗吉尼亚理工大学计算机科学系的 Nurendra Choudhary 和 Chandan K. Reddy,该论文提出了一种利用大型语言模型(LLM)进行知识图谱(KG)复杂逻辑推理的新方法LARK。1. 研究背景对大规模、噪声和不完整的知识图谱进行推理是 AI 研究中的基本且具有挑战性的问题。当前方法在处理复杂查询和数据集通用性方面存在局限性,且训练时间长、可扩展性有限。2. 相关工作逻辑推理:早期方法专注于捕获实体语义信息和关系操作,后续研究通过新的几何模型来编码知识图谱中的。

2024-09-23 15:29:50 702

原创 UMLS手把手安装使用

由于原始的安装MetamorphoSys来使用的方法只是在使用一个程序,这里我们将数据加入MYSQL以方便更多自定义操作。以下是MetamorphoSys操作窗口示意:MetamorphoSys暗装好后会生成一个META文件,再次基础上,可以再安装一个工具QuickUMLSUMLS本身是一个可以快速查询医疗名称的软件,QuickUMLS是一个调用UMLS数据库,能用更短时间返回结果的开源项目。

2024-09-23 15:28:51 573

原创 【2024.09】关于 UMLS 在支持大型语言模型提出的诊断生成中的作用

传统知识型和机器学习型诊断决策支持系统受益于整合统一医学语言系统 (UMLS) 中编码的医学领域知识。大型语言模型 (LLM) 的出现取代了传统系统,提出了模型内部知识表示中医学知识的质量和范围以及对外部知识源的需求的问题。本研究的目标有三个方面:探究流行,研究向 LLM 提供 UMLS 知识(为诊断预测奠定基础)的好处,并评估 LLM 生成过程中人类判断与基于 UMLS 的指标之间的相关性。生物医学语言处理始终严重依赖于统一医学语言系统® (UMLS®) [1];

2024-09-23 12:58:14 767

原创 【快速入门】UMLS使用手册官方-超全翻译(包括图与表翻译)

使用手册章节介绍本章介绍了 UMLS 的用途、可以使用不同 UMLS 组件的条件以及这些条件与开放访问/开放源代码原则的关系。它还简要介绍了每个 UMLS 组件及其之间的关系,建议了建立对 UMLS 特性和功能的理解的方法,并提供了其他 UMLS 参考资料的列表。这些章节介绍了 Metathesaurus 的内容和结构,这是一个大型概念导向型数据库,包含大量生物医学和健康相关词汇、分类和编码系统。Metathesaurus 根据指定的基本语义类型对这些概念进行分类,并使

2024-09-17 18:31:51 832

原创 2024 深度知识追踪(DLKT)全攻略:背景、深度解读与优化路线一网打尽

初始化一个知识状态的隐藏层,通过问题-答案的序列,去更新这个隐藏层状态的参数,最后,将预测问题输入,输出答案结果。相关模型基本介绍DKT利用LSTM层对学生的知识状态进行编码,以预测学生的反应表现。DKT+引入正则解决重构和不一致预测的问题。DKTF模拟了学生的遗忘行为。KQN使用学生知识状态编码器和技能编码器通过点积来预测学生的反应表现。DKVMN设计一个静态密钥矩阵来存储不同知识中心之间的关系,设计一个动态价值矩阵来更新学生的知识状态。本质上还是时间序列预测问题。

2024-09-14 01:34:30 1248 3

原创 【2024.08】图模互补:知识图谱与大模型融合综述-笔记

核心问题就是如何让大模型学习知识图谱信息,一种方式是将知识图谱直接转化为语言文本,但是这破坏了知识图谱的结构信息。另外一种利用深度学习从知识图中提取相关信息[97]。因此在未来需要采用更先进的知识编码策略,如图神经网络,以更好地捕捉知识图谱中的关系和语义信息。知识图谱与大模型融合已经取得一定的成果,如JointLK [104]和QA-GNN[105]通过图神经网络(GNN)将知识图谱与大模型联立起来,DRAGON[107]更是在联合基础上增加自监督学习策略,使得大模型能够理解知识图谱中的结构信息,

2024-09-13 22:38:30 1221

原创 【2022】CLINER:临床询问命名实体识别。

研究背景电子病历(EMR)在现代医疗保健信息系统中至关重要,但医生手动创建 EMR 耗时耗力,自动将医患对话转换为 EMR 成为新兴领域,核心问题是如何从医疗对话中准确提取医疗实体及其状态。现有研究专注于在轮级上下文提取医疗信息,忽略了实体信息的全局一致性和状态,而实体状态对自动生成 EMR 至关重要。在文档中,MIE(Medical Information Extraction)即医疗信息提取,NER(Named Entity Recognition)即命名实体识别。1.医疗信息提取(MIE)

2024-09-13 17:20:59 922

原创 【2024】Benchmarking Foundation Models with Language-Model-as-an-Examiner

已经建立了许多基准来评估基础模型在开放式问题回答方面的性能,这是对模型以类似于人类的方式理解和生成语言的能力的全面测试。这些工作大多集中在提出新的数据集上,然而,我们在以前的基准测试管道中看到了两个主要问题,即测试泄漏和评估自动化。在本文中,我们提出了一个新的基准测试框架 ,语言模型作为一个考官,其中LM作为一个知识渊博的考官,根据其知识制定问题,并以无参考的方式评估回答。我们的框架允许毫不费力地具有可扩展性 ,因为各种lm可以作为考官被采用,并且问题可以不断更新,给定更多样化的 触发主题。

2024-09-11 21:58:25 990

原创 【2024】Math-Shepherd:无需人工注释即可逐步验证和强化法学硕士。

研究背景大语言模型在复杂的多步数学推理问题中面临挑战,验证方法可提高 LLMs 输出的准确性和一致性,其中过程奖励模型(PRM)能提供精确反馈,但训练数据获取成本高。相关工作改善和引发 LLMs 数学推理能力的方法包括预训练、微调、提示等。数学推理验证的两类模型为结果奖励模型(ORM)和过程奖励模型(PRM),PRM 优于 ORM,但依赖昂贵的人工标注数据集。结果奖励模型(ORM)定义:给定一个数学问题和其解决方案,ORM 会根据整个生成序列分配一个实数值来表明该解决方案是否正确。

2024-09-10 18:57:51 1180

原创 【2024】Achilles-Bench:低资源评估的挑战性基准

该论文的主要内容是提出了一个具有挑战性的基准测试集 Achilles - Bench,用于低资源学习的评估。研究背景:随着强大模型的发展,对低资源基准测试的需求增加,但现有的低资源数据集存在一些问题,如难以捕捉数据偏差和现实场景中的难度,导致对模型学习能力的评估不准确。相关工作:介绍了低资源评估学习的相关研究,包括自然低资源数据集和采样低资源数据集,以及构建具有挑战性基准的方法。理解低资源学习的难度。

2024-09-10 11:02:55 797

原创 数学建模优秀论文分析及免费资料分享(3)——2023 出血性脑卒中建模与分析

正态分布的概率密度函数图像是关于均值点处对称的,假设总体服从均值为 u,标准 差为σ的正态分布,那么从该总体中随机抽取一个样本点,该点落在区间[u-3σ,u+3σ]上的概 率约为 99.73%,而超出这个范围的可能性仅占不到 0.3%,是典型的小概率事件,所以这 些超出该范围的数据可以认为是异常值。具体的归一化处理内容 如下。异常的数据值往往会干扰我们对问题的分析过程,影响建立模型的准确度,从而导致 模型求解出的结果偏离实际情况,所以本文对表 1 和表 3 给出的信息进行了一定的异常值 判断和处理。

2024-09-08 16:58:09 1652

原创 2018年以前的语义计算技术梳理

语义计算是理解自然语言的核心内容之一,有助于计算机量化、理解语句或文档的关联程度。依据语义资源的不同,典型的语义相似度计算方法分为以下几类。

2024-09-08 15:51:58 973

原创 【2020】Clinical Concept Embeddings Learned from Massive Sources of MultimodalMedical Data

1. 研究背景词嵌入在自然语言处理中广泛应用,但医疗领域由于隐私等问题缺乏预训练资源。本工作旨在通过结合多模态医疗数据构建医学概念的嵌入。2. 相关算法概述word2vec:包括 CBOW 和 skip - gram 模型,后者通过构建目标词和上下文词的向量表示,使共现频繁的词在新空间中距离更近,其关键特征是能在大型语料库上高效训练,如通过负采样近似计算。GloVe:通过拟合加权对数线性模型到共现统计中产生词嵌入,最终的嵌入是单词和上下文向量之和,训练时最昂贵的步骤是构建术语 - 术语共现矩阵。

2024-09-07 18:03:41 1016

原创 【2022】使用 UMLS 元词库改进医学术语嵌入

提供者使用电子健康记录(EHRs)记录患者信息,其中的医疗笔记在医学信息学应用中很有价值,而学习医疗术语的向量表示是分析医疗笔记的重要预处理步骤,但学习好的嵌入很有挑战性,因为医疗笔记术语丰富且 EHRs 数量有限。主要贡献提出一种新算法 definition2vec,用于从有限的医疗笔记中学习医疗术语的嵌入,该算法扩展了 skip - gram 算法,利用了统一医学语言系统(UMLS)元词典提供的医疗术语定义的外部信息。

2024-09-07 09:58:54 682

原创 【2023】《A New Semantic Similarity Scheme for more Accurate Identification in Medical Data》

*剩余挑战和未来工作**: - 为了更准确地比较不同地区的医疗数据,需要拓宽昵称、缩写和同义词的存储库,以包括更多地理上多样化的单词和短语,但这可能会对性能产生负面影响,因为潜在匹配数量可能会大幅增加,特别是当提取的令牌集大小特别大时。综上所述,SSIM 算法的分层方法通过逐步考虑不同层次的因素,从具体的字符串片段匹配到使用昵称、缩写和初始的比较,再到字母分组特征的考虑,以及加权值的应用,来确定两个文本之间的相似性。为了获得文章中公布结果所使用的权重,是根据特定的数据集通过试验和错误进行调整的。

2024-09-04 23:02:51 937

原创 数学建模优秀论文分析及免费资料分享(2)——2023 出血性脑卒中建模与分析

本题主要包含六个附件数据,各附件名称及内容见表1.1所示。1、Logistic 回归Logistic 回归分析属于非线性回归,它是研究因变量为二项分类或多项分类结果与某 些影响因素之间关系的一种多重回归分析方法。该模型的核心思想在于通过建立一个 逻辑函数(Logistic 函数)来估计一个样本属于某一类别的概率,即将输入的特征映射到 一个概率输出,用于描述事件发生的可能性。Logistic 回归模型的逻辑函数采用了 S 形曲线,其输出值在 0 到 1 之间,可以表示为概 率。

2024-09-04 11:10:33 899

原创 UMLS(统一医学语言系统)—— 小白最强攻略(讲解+运用)

UMLS (Unified Medical Language System),是由美国国立医学图书馆(NLM)开发的,旨在通过整合各种生物医学术语系统来促进医学信息的统一检索和应用。链接:https://uts.nlm.nih.gov/uts/signUpUMLS参考手册:https://www.ncbi.nlm.nih.gov/books/NBK9676/

2024-09-01 18:31:41 1346

原创 【2020.6.3】使用单词和图的嵌入来衡量统一医学语言系统概念之间的语义相关性

使用词或者图嵌入自动计算相似度的相关论文及思考

2024-09-01 18:25:05 1186

原创 数学建模优秀论文分析及免费资料分享(1)——2022 E草原放牧问题 1

数学建模优秀论文分析及免费资料分享(1)——2022 E草原放牧问题 1

2024-09-01 10:23:21 1509

原创 2024”华为杯“数学建模小白全攻略【近五年题目、获奖名单、类型、策略】

2024华为杯数学建模良心讲解

2024-08-22 17:10:13 12612 3

原创 Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents (2024.5)

通过使代理能够通过模拟中的持续交互和反馈循环来完善和扩展他们的专业知识,该策略增强了他们的能力,而无需任何手动标记的数据。7.3 未来工作 我们对代理医院的未来计划主要包括以下内容: 1) 扩大模拟中涵盖的疾病范围,并扩展到更多的医疗部门,旨在反映真实医院提供的全面服务,供进一步研究。对于治疗失败的情况,医生有责任反思和分析诊断不准确的原因,提炼出指导原则,作为后续处理过程的警示提醒。虽然与模拟医疗数据集的选择来自预定义的集合(例如,诊断选择是提到的八种疾病)不同,但这里的多项选择题都是LLM生成的。

2024-08-02 15:46:49 918

原创 【24最新】贵大计算机研究生复试攻略(最新复试真题+信息收集+上机题库+准备材料+综合面试)

疫情开放后第一年的线下复试的资料,包括真题、流程、时间安排和各种细节,以及超级详细的准备资料。不买资料也没关系,可以看看超详细的流程介绍,绝对缓解附属焦虑【【24最新】贵大计算机研究生复试24最新全流程攻略!一篇就够,超详细!(1-简介)-哔哩哔哩】 https://b23.tv/BuTarRh资料见b站工坊。

2024-02-06 21:43:19 760 1

原创 【小白记录】记录疯狂踩坑的《动手学深度学习pytorch》windows10的环境配置,miniconda+GPU+CUDA+CUDNN+Jupter

保存了太多图片,无法直接复制过来,大家可以下载pdf看看。

2023-08-10 23:16:52 164 1

原创 简单的markdown语法使用

简单的markdown语法使用井号,空格,表示标题二级标题,两个井号 空格三级标题,三个空格,也可以使用ctrl+(1~6)四级标题 注意不能使用小键盘,f11可以对界面放缩我是五级标题嘻嘻嘻,我是六级字体引用图片超链接列表表格代码井号,空格,表示标题二级标题,两个井号 空格三级标题,三个空格,也可以使用ctrl+(1~6)四级标题 注意不能使用小键盘,f11可以对界面放缩我是五级标题嘻嘻嘻,我是六级你可以看看大纲,他们是缩进关系,没有七级标题,你猜我这段文字是不是属于六级字体斜体,一个星

2021-10-01 08:45:18 276

Benchmarking Foundation Models with Language-Model-as-an-Examine

Benchmarking Foundation Models with Language-Model-as-an-Examine

2024-09-11

数学建模优秀论文分析及免费资料分享(3)-2023 出血性脑卒中建模与分析2

数学建模优秀论文分析及免费资料分享(3)-2023 出血性脑卒中建模与分析2

2024-09-08

数学建模优秀论文分析及免费资料分享(2)-2023 出血性脑卒中建模与分析

数学建模优秀论文分析及免费资料分享(2)-2023 出血性脑卒中建模与分析

2024-09-05

A New Semantic Similarity Scheme for more Accurate

A New Semantic Similarity Scheme for more Accurate

2024-09-04

2020.6.3使用单词和图的嵌入来衡量统一医学语言系统概念之间的语义相关性

【2020.6.3】使用单词和图的嵌入来衡量统一医学语言系统概念之间的语义相关性

2024-09-01

数学建模优秀论文分析及免费资料分享(1)-2022 E草原放牧问题 1

论文+笔记

2024-09-01

2024华为杯数学建模21-24近三年获奖名单+攻略

2024华为杯数学建模21-24近三年获奖名单+攻略

2024-08-22

疯狂踩坑的《动手学深度学习pytorch》windows10的环境,miniconda+GPU+Jupter

从moniconda,到pytorcch到d2l包,pandas,所以的过程都有

2023-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除