UMLS手把手安装使用

去官网下载压缩包

内部的小压缩包要和其它文件解压到同一级

win64双击以下程序

出现MetamorphoSys运行界面,先不要轻举妄动,看看readme和各种手册以防止安装错误。

以下是README.txt的翻译

        

2024 年 5 月

README

UMLS 2024AA 版本发布

新内容

统一医学语言系统(R)(UMLS)知识源的 2024AA 版本自 2024 年 5 月 6 日起可供下载。

可下载的内容有:

  • UMLS 元数据预计算子集(无需安装,更多信息见下文。)
  • MRCONSO.RRF 文件(最广泛使用的元数据文件。)
  • 完整版本(UMLS 元数据、语义网络、专业词典和词汇工具、数据库加载脚本以及用于自定义 UMLS 子集和浏览数据的 MetamorphoSys。
  • UMLS 元数据历史文件(包含来自 UMLS 元数据的历史数据的文件。)

UMLS 元数据预计算子集

在过去的几年中,我们要求使用 MetamorphoSys 来安装和自定义 UMLS 元数据。现在,我们提供两个无需安装或自定义即可使用的 UMLS 元数据预计算子集。

  • UMLS 元数据完整子集(完整的元数据数据,无需任何自定义。)
  • UMLS 元数据 0 级子集(仅包括 0 级源词汇表。0 级词汇表除了标准许可条款外没有任何其他限制。)

UMLS 元数据历史文件

  • 概念历史(MRCONSO_HISTORY.txt)—— 此文件包含自 2004AA 版本起从 UMLS 元数据 MRCONSO.RRF 中删除的所有原子、概念和代码。
  • 关系历史(MRREL_HISTORY.txt)—— 此文件包含自 2004AA 版本起从 UMLS 元数据 MRREL.RRF 文件中删除的所有关系。
  • 源词汇历史(MRSAB_HISTORY.txt)—— 此文件包含自 2004AA 版本起在 UMLS 元数据 MRSAB.RRF 文件中更新的每个 UMLS 源词汇的每个版本的一行。
    这些文件可从 UMLS 下载页面获取:UMLS Knowledge Sources: File Downloads

如果你发现这些文件有用,请使用主题 “UMLS 历史文件” 向 NLM 帮助台(Write to the Help Desk · NLM Customer Support Center)发表评论。

元数据

2024AA 元数据包含来自 187 个源词汇表的约 338 万个概念和 1640 万个唯一概念名称。

两个新的翻译:

  • MDREST(爱沙尼亚版的《监管活动术语医学词典》(MedDRA)。)
  • MDRFIN(芬兰版的《监管活动术语医学词典》(MedDRA)。)

33 个英语源和 46 个翻译源已更新。其中包括 MeSHR、MedDRA、RxNorm 和 SNOMED CTR(英语和西班牙语)。有关此版本元数据的更改的详细信息,请参阅 “更新的源(扩展)” 部分。更多发布统计信息可在 “统计” 部分找到。

【看看有没有中文源,再看看还有哪些常用语言】

专业词典和词汇工具

  • 此版本包括更新后的 SPECIALIST 词典(2024 版本)。
  • 此版本包括更新后的词汇工具(2024 版本),它整合了来自 2024 版本 SPECIALIST 词典的数据。词汇工具包括 lvg.2024 的完整版本和精简版本。
    元数据索引文件使用更新后的 lvg 文件进行处理。

MetamorphoSys

  • 完整版本需要 35.1GB 的磁盘空间。

已报告的错误可在 “发行说明和错误” 网页上查看。

在创建元数据子集或安装语义网络时,MetamorphoSys 可以为 MySQL、Oracle 或 Microsoft Access 生成自定义加载脚本。UMLS 加载脚本主页上提供了说明。说明书位置如下:UMLS - Load Scripts

发布信息

要访问 UMLS 发布文件,你必须拥有有效的 UMLS 元数据许可证和有效的 UTS 帐户。下载文件时,系统将提示你使用 UTS 的身份提供商进行身份验证。

UMLS 学习资源

2024AA 源发布文档网页可用。

有关 UMLS 的更多信息可在 UMLS 主页上找到。鼓励新用户参加 UMLS 基础教程并探索其他培训材料。

UMLS 术语服务(UTS)

UTS 元数据浏览器和 UTS REST API 包括更新后的版本。

新术语发布 API 端点

此端点提供 RxNorm、SNOMED CT 和 UMLS 的更新版本列表。你可以使用此端点完全自动化检索最新发布文件,而无需手动下载文件。例如,如果你每周或每月加载 RxNorm 数据,你可以监控我们的发布 API,并在数据可用时立即自动下载。

文档:
Automating UMLS Terminology Services Downloads

示例:
请求所有 RxNorm 完整月度版本:
https://uts-ws.nlm.nih.gov/releases?releaseType=rxnorm-full-monthly-release

请求当前 RxNorm 完整月度版本:
https://uts-ws.nlm.nih.gov/releases?releaseType=rxnorm-full-monthly-release&current=true
{
"fileName": "RxNorm_full_01022024.zip",
"releaseVersion": "2024-01-02",
"releaseDate": "2024-01-02",
"downloadUrl": UMLS Metathesaurus Browser,
"releaseType": "RxNorm Full Monthly Release",
"product": "RxNorm",
"current": true
}

下载当前 RxNorm 完整月度版本:
curl "https://uts-ws.nlm.nih.gov/download?url=https://download.nlm.nih.gov/umls/kss/rxnorm/RxNorm_full_01022024.zip&apiKey=YOUR_API_KEY" -o RxNorm_full_01022024.zip

UMLS 用户贡献

UMLS 用户通过开发 API、自动化脚本和自然语言处理工具以各种方式扩展了 UMLS 的功能。你可以在 UMLS 社区网页上找到这些列表:UMLS Community - User Contributions

想添加你的工具吗?向 NLM 帮助台(Write to the Help Desk · NLM Customer Support Center)发送请求,主题为:“UMLS 社区”。

务必包含指向你的源代码的链接,以便其他 UMLS 用户可以改编你的工具。我们特别感兴趣的是:

  • 数据库加载脚本
  • 将 UMLS 数据转换为其他格式(例如,RDF 或 JSON)的转换脚本
  • 自动化 UMLS 安装任何方面的脚本
  • 在文本处理中利用 UMLS 的应用程序

我们重视你的反馈!有关我们根据用户反馈对 UMLS 所做的改进以及有关 UMLS 一般使用情况的信息,请参阅我们的 UMLS 用户反馈页面:UMLS User Feedback

有关统一医学语言系统(UMLS)的信息,请查询 UMLS 主页:Unified Medical Language System (UMLS)

最新的发行说明列出了所有已知问题,包括错误和修复,可在以下位置获取:2024AA UMLS® Release Notes and Bugs

UMLS 数据文件和 MetamorphoSys 可从 UMLS 网站下载:UMLS Knowledge Sources: File Downloads。用户必须拥有有效的 UMLS 术语服务(UTS)帐户才能下载文件。所有文件必须下载到同一目录中。MetamorphoSys 在使用前必须解压缩。

硬件和软件要求

支持的操作系统:

Windows
Linux
macOS

硬件要求

  • 至少 40GB 的可用硬盘空间。
  • 至少 2GB 的 RAM,最好更多。较小的内存大小将导致虚拟内存分页,处理时间呈指数增长。
  • CPU 速度至少为 2GHz,以实现合理的安装时间。

以下是MetamorphoSys官方手册

UMLS - MetamorphoSys

MetamorphoSys 帮助

MetamorphoSys 是每个 UMLS 版本中包含的 UMLS 安装向导和 Metathesaurus 自定义工具。MetamorphoSys 安装一个或多个 UMLS 知识源,并允许您创建自定义 Metathesaurus 子集。每个 UMLS 版本都包含更新版本的 MetamorphoSys。仅使用与最新 UMLS 版本一起分发的 MetamorphoSys 版本。

安装、定制并子集化 UMLS

网页中有具体视频

系统要求

MetamorphoSys 已在以下操作系统上测试:

  • Windows 7 企业版、Vista、XP
  • Linux*
  • Macintosh OS X(Leopard、Snow Leopard)

*Linux 注意事项:所有版本均在 Ubuntu Desktop 下进行了全面测试。其他 Linux 版本可能同样适用。

硬件要求

  • 至少 30 GB 的可用硬盘空间。
  • 至少 2 GB 的 RAM,最好更多。较小的内存大小将导致虚拟内存分页,处理时间成倍增加。
  • 为保证合理的安装时间,CPU 速度至少为 2 GHz。

使用高速互联网连接从 UMLS 网站下载文件。下载并解压所有 UMLS 数据和 zip 文件到同一目录。

安装时会检查所有文件大小。验证分发选项允许用户验证下载的 .nlm 文件的完整性。它会将特殊 MD5 签名与发布 MD5 和 CHK 文件中的签名进行比较,这是在 UMLS 安装出现问题时进行故障排除的有用第一步。

下载 UMLS 版本后,它必须在同一目录中包含以下文件*

  • mmsys.zip(压缩的 MetamorphoSys 应用程序)
  • 2016aa-1-meta.nlm(压缩的元词库数据)
  • 2016aa-2-meta.nlm(压缩的元词库数据)
  • 2016aa-otherks.nlm(压缩语义网络和专家词典)
  • 2016AA.CHK
  • 2016AA.MD5
  • 版权声明.txt
  • 自述文件.txt

您必须将 mmsys.zip 解压到与其他下载文件相同的目录中。解压文件后,您应该会在目录中看到以下文件列表。mmsys.zip 文件必须保留在同一目录中。

下载并解压的文件

*2016AA UMLS 版本的文件名按字母顺序排列。

 

启动 MetamorphoSys

您可以通过以下任一方式启动 MetamorphoSys: 1. 双击适合您平台的文件。 或者 2. 打开终端窗口并更改到下载文件的目录,然后键入适合您平台的命令:

  • ./run.bat 或 ./run64.bat (Windows)
  • ./run_mac.sh(或单击 run_mac.command 文件)
  • 运行

一旦执行了适当的命令,MetamorphoSys 应用程序就会启动。

 

MetamorphoSys 屏幕和标签

MetamorphoSys 屏幕和选项卡将引导您完成安装 UMLS 知识源和定制 Metathesaurus 的过程。

欢迎来到 MetamorphoSys

选择下列选项之一:

  1. 安装 UMLS — 安装一个或多个 UMLS 知识源。
  2. 浏览我的子集 — 打开 RRF 子集浏览器。

文件菜单选项:
验证分发
退出

高级菜单选项:


自定义我的子集(自定义现有的元词库子集)
构建 MRCXT(打开 MRCXT 构建器)
将数据库加载脚本复制到硬盘(将数据库加载脚本复制到本地存储)

验证分布确认所有 UMLS 文件已正确传输且完整。该过程大约需要 30 分钟,并生成一个日志文件 (validation.log) 和一个警告框,其中显示有关文件有效性的声明。遇到任何故障时,请使用验证分布作为故障排除的第一步。

为了创建正确的子集,请使用与要子集化的 Metathesaurus 发布文件版本相匹配的 MetamorphoSys 版本。请勿将旧版本的 MetamorphoSys 与较新或较旧的发布文件一起使用;请使用发布文件附带的 MetamorphoSys 版本。

安装 UMLS

MetamorphoSys 在本地存储中为 UMLS 知识源创建顶级目标目录。该目录以 UMLS 发布版本命名,例如:2016AA。在目标目录下创建以下目录结构,如下所示为 2016AA 版本:

<安装目录>

2016AA

莱克斯

按如下方式安装任意一个、两个或所有三个知识源:

选择

安装至

语义网络NET 目录
专业词汇LEX 目录
变形系统MMSYS 目录

META 目录中包含安装期间创建的 Metathesaurus 子集文件。根据您的配置,其中一些文件可能包含零字节。

使用浏览按钮找到源目录和目标目录位置。

单击“确定”继续安装。进度监视器跟踪安装过程的每个步骤。如果选择了 Metathesaurus,则在选择了所有 Metathesaurus 选项后,安装将开始。

要随时取消安装,请单击安装 UMLS 进度屏幕底部或 MetamorphoSys 进度窗口底部的“取消”。

MetamorphoSys 配置

配置文件包含已选择的所有选项和过滤器。通过保存配置文件,用户可以精确地重现子集。选择“新建配置”可创建新的子集配置。选择“打开配置”可打开之前保存的配置文件。

许可协议声明

元词库包含由许多不同版权持有者制作的源词汇。元词库的大部分内容均可根据 UMLS 元词库许可协议中描述的基本(且相当开放)条款使用。

一些词汇制作者对元同义词库中分发的内容的使用施加了额外的限制。

UMLS 元词库许可证第 12 节描述了附加限制的级别。UMLS 元词库许可证附录 1 列出了单个词汇及其限制级别。如果您已经拥有其中一个源词汇的单独许可证,则您现有的许可证也适用于元词库中分发的该源。在某些情况下,您可能需要请求许可或与词汇制作者协商单独的许可证才能在生产系统中使用该词汇。这些单独的许可或许可协议可能会产生费用。

查看 UMLS 元词库许可证后,单击“接受”或“不接受”。

选择默认子集

您必须选择四个预定义的默认子集之一作为起点。

Metamorphosys-选择默认子集配置窗口

  1. 活动子集:排除 UMLS 元同义词库中多年未更新的“遗留”来源。
  2. 0 级:包含词汇源,除了 UMLS 许可之外不需要任何额外的许可协议。
  3. 0 级 + SNOMED CT:包含所有 0 级源和 SNOMED CT。
  4. SNOMEDCT + SCTUSX:仅包括 SNOMED CT 和 SNOMED CT 的美国扩展。

使用“源列表”选项卡来修改您的默认子集。

我们鼓励您通过点击页面顶部的联系链接为未来版本建议其他默认子集。

 

自定义元同义词库选项卡

选项标签

输入选项
输出选项
源列表
优先级
抑制

按任意顺序选择并完成选项选项卡。请注意,在一个选项选项卡中所做的选择可能会影响其他选项选项卡上的显示和可用选项。

在菜单栏上选择“重置”,然后选择适当的重置命令将任何选项重置为默认设置。

完成 Metathesaurus 子集的配置后,转到菜单栏,选择“完成”,然后选择“开始子集”。

系统将提示您保存配置。命名您的配置文件,该文件将存储在目标 META 目录中。此文件记录您的配置选择,并可用作以后使用欢迎屏幕上的自定义我的子集选项进行自定义的起点。

输入选项选项卡

此选项卡允许用户指示所需目录、配置文件以及输入和输出目录的位置。

对于初始安装,必须选择 NLM 数据文件格式。

自定义现有子集时,使用浏览选择其当前格式:原始发布格式或丰富发布格式。

输出选项选项卡

  • 选择输出格式
    选择 Rich Release Format 或 Original Release Format。Rich Release Format 是初始安装和自定义 Rich Release Format 中现有子集的默认选择。Original Release Format 是自定义 Original Release Format 中现有子集的默认选择。注意:您无法从 Original Release 生成正确的 Rich Release Format 子集
     
  • 子集文件夹
    指示应放置新子集文件的位置。
     
  • 编写数据库加载脚本
    以 Oracle 或 MySQL 格式输出加载脚本,您可以进一步优化或自定义。有关 UMLS 加载脚本的更多信息,请参阅加载脚本页面。
  • 来源缩写格式
    元词库内容中的来源词汇信息可以通过无版本或根来源缩写 (RSAB) 来识别,也可以通过更长且更具描述性的版本化来源缩写 (VSAB) 来识别。默认为 RSAB,但您可以选择包含 VSAB。例如,
    • MSH 是根源缩写 (RSAB)
    • MSH_2003_12_12 是版本源缩写 (VSAB)
    无论哪种情况,您的子集都将包含 MRSAB 文件,该文件将 RSAB 链接到子集中所有源词汇的相应 VSAB。
     
  • 最大字段长度
    将输出中的字段限制为应用程序或数据库软件允许的最大字段长度。从 2007AA 版本开始,此字段的默认值为 3990 个字符。
     
  • 仅删除 MTH 概念
    选择此选项仅当 MTH 原子与子集中其他来源的原子重叠时保留它们。
     
  • 计算输出文件的 MD5 值
    选中此框后,MD5 算法将在 Metathesaurus 子集目录中生成 mmsys.md5 文件。此文件中的信息可用于验证 Metathesaurus 文件 (RRF 或 ORF) 的数据完整性,并且在解决问题时非常有用。MD5 值出现在 META/mmsys.md5 文件中。请注意,这些 MD5 用于比较不同的运行,并以独立于平台的方式计算,并且它们会忽略不同的行终止。因此,本机 MD5 计算程序可能与 mmsys.md5 文件中的程序不同。
     
  • 将 UTF-8 BOM 字符添加到输出文件
    选中此框后,所有输出数据文件前面都会添加一个字节顺序标记。此文件开头标记(3 个字节)表示文件采用 UTF-8 编码。
     
  • 建立浏览器索引文件
    此选项创建 RRF 浏览器用来查找数据的索引文件。强烈建议选中此框。取消选中此选项将导致 RRF 浏览器运行速度变慢。

源列表选项卡

“来源列表”选项卡显示当前版本的 Metathesaurus 中的所有来源词汇。默认显示中,来源按来源缩写字母顺序排列。“来源列表”选项卡顶部有两个单选按钮:

源列表选项

突出显示的来源反映了在安装过程中先前选择的默认子集。您可以选择或取消选择要包括或排除在子集中的其他来源。将按钮设置为“选择要从子集中排除的来源”,以突出显示将从自定义 Metathesaurus 子集中删除的来源。

或者您可以选择“选择要包含在子集中的源”。选择后,只有突出显示的源才会包含在您的本地子集中。

注意:在这两个选项之间切换时,突出显示的源不会发生变化。如果某个源突出显示以将其从子集中排除,并且您选择“选择要包含在子集中的源”,则该源现在将突出显示以将其包含在您的子集中。

要选择或取消选择其他行,请在进行选择时按住 <CTRL> 键。

您可以按完整源名称、源缩写、源系列、语言或级别(UMLS 许可限制级别)对源列表进行排序。单击列标题可按该数据对列表重新排序。

完整的 Metathesaurus 包含超过 150 个源词汇表,其整体上是一组非常庞大且难以处理的数据文件。请仔细考虑哪些来源将为您的应用程序提供有用的数据,然后排除其他来源,以减少输出子集的大小并提高应用程序性能。

还请考虑某些来源的数据可能与您的预期应用不兼容。它们可能包含仅在特定来源的上下文中才能识别的术语;或者它们可能包含令人困惑的缩写,或者对您的应用不是特别有用的缩写。

更多信息源词汇表可在UMLS 源发布文档下找到。您还可以联系许可协议附录中包含的源提供商以获取其他文档或信息。

您可以根据完整来源名称或来源缩写选择要删除的单个来源。您可以利用相关词汇组(称为来源系列)来帮助在选择一个来源时删除相关来源。

例如,请注意,CPT(美国医学会医师最新程序术语,CPT4)也是 HCPT(美国医疗保健融资管理局通用程序编码系统,HCPCS)的一部分。必须删除这两个词汇表才能排除所有 CPT 信息来源。

您还可以按语言或许可限制级别排除来源。要重置来源选择并返回默认列表,请在菜单栏上的“重置”下选择“重置来源以排除默认值”。

优先选项卡

优先顺序选项卡显示由 NLM 确定的 Metathesaurus 源和术语类型组合的默认优先顺序。一个英文术语中的一个字符串被指定并标记为 Metathesaurus 中每个概念的默认首选名称。任何 Metathesaurus 概念的默认首选名称的选择都基于所有 Metathesaurus 源词汇表中所有类型的英文字符串的优先顺序。不同类型的字符串(例如,每个词汇表中的首选术语、交叉引用和缩写)在此顺序中的位置将有所不同。

NLM 确定的默认优先顺序并不适用于 Metathesaurus 的所有应用程序。MetamorphoSys 可用于更改首选名称的选择,以从最适合特定用户群体的源词汇表中选择术语。

您可以通过剪切粘贴或拖放优先列表中的行来重新排列来源和术语类型组合的排名。已在来源列表选项卡中排除的来源的术语类型将不会显示。

来源和术语类型的排名将影响输出子集。具体而言,概念的名称将由该概念中排名最高的术语类型决定。

可抑制性选项卡

“可抑制性”选项卡显示要在输出子集中标记为可抑制的源/术语类型组合。已从源列表中排除的源的术语类型将不会显示。对于新子集,初始显示将突出显示由 NLM 设置为可抑制的默认源/术语类型。您可以选择或取消选择要在输出子集中标记为可抑制的源/术语类型。自定义现有子集时,初始显示将突出显示该子集的可抑制性设置。

 

MetamorphoSys 元词库过滤器

MetamorphoSys 过滤器允许用户创建包含特定术语组的自定义子集。启用/禁用过滤器选项列在文件菜单下。启用过滤器后,其对应的选项卡将出现在 UMLS 元词库配置屏幕上。禁用过滤器后,其选项卡将消失。选择每个过滤器后,帮助菜单上将显示该过滤器的特定帮助信息选项。当前过滤器为:

  • 属性类型列表
  • 内容查看列表
  • 语言列表
  • 关系列表
  • 示例元数据
  • 语义类型列表
  • 源子集列表
  • 源术语类型列表
  • 界面列表
  • 统一码

导入过滤器

此命令允许用户导入根据 Filter API 开发的过滤器。过滤器无法从应用程序中导出或删除,但可以禁用。将弹出一个窗口,其中显示所有可导入的过滤器。这些过滤器位于 METAMSYS/ext 目录中。

提供了两个简单的导入过滤器作为自定义过滤的示例:

  • NosNec(用于测试):从输出子集中排除“NOS”或“NEC”字符串
  • OddEven(用于测试):从输出子集中排除奇数或偶数 CUI

当选择导入过滤器时,其选项选项卡会出现在元词库配置屏幕上。

 

高级用户的选项

MetamorphoSys 选项

打开一个包含以下用户功能的配置窗口:

自动选择相关项 - 如果选中此复选框,则当所选行共享源系列或具有从属源时不会出现提示。系统会自动选择从属源行或具有相同源系列的行。此标志的默认值为 false。

高级源列表选项

打开一个包含以下用户功能的配置窗口:

强制选择家庭

如果选择了“强制系列选择”,系统将提示您选择同一源系列中的其他源。

强制依赖源选择

如果选择了“强制依赖源选择”,并在“依赖源关联”表中选择一个源,则可以选择列出的任何依赖源。与“强制系列选择”一样,此功能也可用于取消选择源。此标志的默认值为 True。

此选择还提供以下功能:

  • 单击添加按钮将源/依赖源关系添加到依赖源关联表。
  • 单击清除按钮可以清除整个表格。
  • 单击特定的行并按“删除”按钮以删除该行。
  • 单击“源”或“相关源”表标题可对表进行排序。
  • 单击表头可进行反向排序。
  • 单击窗口底部的完成按钮退出高级选项对话框。

高级抑制选项(删除可抑制数据)

您可以指定从自定义子集中排除哪三种可抑制数据:

  • 源术语类型:术语组被标记为可按源/术语类型抑制。
  • 指定编辑:特定术语被 Metathesaurus 编辑标记为可抑制。
  • 已过时:在源词汇表中被标识为已过时的术语。

丰富发布格式 (RRF)
如果您选择删除源术语类型可抑制数据,则将删除 SUPPRESS 标志设置为 Y 的数据。
如果您选择删除编辑器分配的可抑制数据,则将删除 SUPPRESS 标志设置为 E 的数据。
如果您选择删除过时数据,则将删除 SUPPRESS 标志设置为 O 的数据。

原始发布格式 (ORF)
在 ORF 中,所有三种类型的可抑制性均由 ts=s 或 ts=p 表示。仅选择上述一个或两个选项将导致子集仍包含一些 ts=s 或 ts=p 的术语。

要排除的高级语义类型


当从文件菜单中启用要排除的语义类型过滤器时,这些选项可用,并允许您设置概念删除的谓词。有两种选择:

  1. 删除具有任意选定语义类型的概念 - 如果选择了此选项,则如果该概念的任何语义类型出现在排除列表中,则该概念将被删除。
  2. 删除具有所有选定语义类型的概念 - 如果选择了此选项,则仅当所有语义类型都在排除列表中时才会删除概念。

 

完成子集

探索完所有选项并完成 Metathesaurus 子集配置后,从菜单栏中选择“完成”,然后选择“开始子集”。要保存配置以便以后创建子集,请从“文件”菜单中选择“保存配置”。

要将所有筛选选项卡(输入选项、输出选项、源列表、优先级和可抑制性)恢复为 Metathesaurus 默认选择,请使用重置菜单。默认选择是配置文件夹中 mmsys.prop.default 文件中列出的选择。mmsys.prop.sav 文件包含上次运行 MetamorphoSys 时使用的属性。请注意:版本选择(原始发布格式或丰富发布格式)不会在输出选项选项卡和输入选项选项卡上重置。

安装 UMLS 元词库进度监视器通过以下步骤绘制该过程:初始化 CUI 列表;子集内容、子集索引和最终流程。要随时停止处理并退出 MetamorphoSys,请按进度监视器底部的“取消”。中断的过程无法恢复。必须调用配置(如果已保存)或重新创建配置(如果未保存),并且必须再次开始子集。

MetamorphoSys 在发布目录中生成一个 install.log 文件,其中包含安装过程的日志,直至 Metathesaurus 子集开始。它记录选择了哪些操作,并报告针对 CHK 和 MD5 文件的文件验证结果。如果下载的文件通过验证,则处理继续并开始子集。如果文件未通过验证,则显示 install.log。

子集化完成后,进度和错误消息以及配置设置将显示在屏幕上,并写入包含子集化文件的目录中名为 mmsys.log 的日志文件。子集化的 Metathesaurus 文件位于所选目标目录中。

上次审核日期:2019 年 4 月 25 日

3.数据库脚本及介绍

由于原始的安装MetamorphoSys来使用的方法只是在使用一个程序,这里我们将数据加入MYSQL以方便更多自定义操作。以下是MetamorphoSys操作窗口示意:

MetamorphoSys暗装好后会生成一个META文件,再次基础上,可以再安装一个工具QuickUMLS

UMLS本身是一个可以快速查询医疗名称的软件,QuickUMLS是一个调用UMLS数据库,能用更短时间返回结果的开源项目。https://github.com/Georgetown-IR-Lab/QuickUMLS
在这里插入图片描述
按照里面的readme配置即可,需要注意的是这一切命令都是在QucikUMLS文件夹路径下的终端内输入的(即windows下的cmd里输入),直接在PyCharm里的Terminal里输入也行。
上图中还需注意红线内的配置命令。

python -m quickumls.install <umls_installation_path> <destination_path>

umls_installation_path就是上文所提到的META文件路径,QuickUMLS通过META文件给自己新生成的一个数据集,destination_path就是这个数据集将要存放的位置。
这里举一个命令例子。我们可以看到,使用Quickstart可以使用python命令获得返回结果。

下面补充以下QuickUMLS的用法:

QuickUMLS 对象可以按如下方式实例化:

from quickumls import QuickUMLS

matcher = QuickUMLS(quickumls_fp, overlapping_criteria, threshold,
                    similarity_name, window, accepted_semtypes)

说明:

  • quickumls_fp是安装 QuickUMLS 数据文件的目录。
  • overlapping_criteria(可选,默认值:“score”)是用于处理重叠概念的标准;如果应首先考虑概念的匹配分数,则选择“score”,如果应首先考虑最长的分数,则选择“length”。
  • threshold(可选,默认值:0.7)是字符串之间的最小相似度值。
  • similarity_name(可选,默认值:“jaccard”)是要使用的相似度的名称。在“dice”、“jaccard”、“cosine”或“overlap”之间进行选择。
  • window(可选,默认值:5)是考虑匹配的最大标记数。
  • accepted_semtypes(可选,默认:参见constants.py)是概念应属于的 UMLS 语义类型集。语义类型由字母“T”后跟三个数字标识(例如,“T131”,标识类型“有害或有毒物质”)。请参阅此处查看完整列表。

要使用匹配器,只需调用

text = "The ulna has dislocated posteriorly from the trochlea of the humerus."
matcher.match(text, best_match=True, ignore_syntax=False)

如果要返回重叠候选项,则设置best_match为,以禁用 (Soldaini and Goharian, 2016) 中引入的所有启发式方法。Falseignore_syntaxTrue

如果匹配器在初始化期间抛出警告,请阅读此页面以了解原因以及如何阻止它这样做。

spaCy 管道组件

QuickUMLS 可用于独立处理,但也可以用作模块化 spaCy 管道中的组件。这遵循了 spaCy 处理概念的传统方式,即向 Document 对象添加实体对象。这些实体对象包含 spacy“下划线”对象中的 CUI、相似度分数和语义类型。

将 QuickUMLS 添加为管道中的组件可以按如下方式完成:

from quickumls.spacy_component import SpacyQuickUMLS

# common English pipeline
nlp = spacy.load('en_core_web_sm')

quickumls_component = SpacyQuickUMLS(nlp, 'PATH_TO_QUICKUMLS_DATA')
nlp.add_pipe(quickumls_component)

doc = nlp('Pt c/o shortness of breath, chest pain, nausea, vomiting, diarrrhea')

for ent in doc.ents:
    print('Entity text : {}'.format(ent.text))
    print('Label (UMLS CUI) : {}'.format(ent.label_))
    print('Similarity : {}'.format(ent._.similarity))
    print('Semtypes : {}'.format(ent._.semtypes))

丰富的发布格式 MySQL 加载脚本

本文档是使用 MetamorphoSys 创建的脚本和文件将 UMLS Metathesaurus 的 RRF 子集加载到 MySQL 数据库的指南。要在创建子集时生成必要的文件和脚本,请在“输出选项”选项卡的“写入数据库加载脚本”部分中选择 MySQL 数据库。您也可以在创建子集后生成这些文件:从 MetamorphoSys 欢迎屏幕中选择“高级”,然后选择“将数据库加载脚本复制到硬盘”。

推荐软件版本:MySQL Server 5.5

【这里我先安装了5.5,结果所需要的c++2008文件太老了官网已经不维护了,无法下载,我改到5.7.30】

使用 MySQL 5.6 版本的 MySQL 用户请注意:

MySQL 5.6 及以上版本默认使用 InnoDB 存储引擎。用户报告称,在将 RRF 数据加载到 MySQL 5.6 数据库时,由于默认的 InnoDB 设置将所有表和索引存储在系统表空间中,因此会出现磁盘空间问题。MySQL 5.6.6 现在将“innodb_file_per_table”配置设置设置为“ON”,以便为每个新创建的表和索引分配一个单独的 .idb 数据文件。用户应阅读MySQL 文档以获取更多信息。

创建数据库

为了将子集加载到 MySQL 数据库中,您必须使用现有数据库或创建新数据库。创建 MySQL 数据库时需要考虑两个重要事项,即默认字符集和排序规则设置。我们建议使用 UTF8 和 utf8_unicode_ci 排序规则设置。例如:

如果不存在则创建数据库umls 字符集utf8 COLLATE utf8_unicode_ci;

配置性能参数

为了优化读取性能,MySQL 5.5 服务器需要更改缓冲区大小以利用可用内存。每个参数都取决于每台服务器上的内存量,并且应在 my.cnf 或 my.ini 文件中适当调整大小

【这里我的操作如下,但是操作后,会导致MYSQL无法启动,navicat也无法连接,最后又改回来了,这里留着给后续可能操作提供参考:

一般情况下,my.ini 在 MySql 安装的根目录下,也有可能在隐藏文件夹“ProgramData”下面。

  1. 编辑配置文件:

    • 使用文本编辑器(如记事本)打开my.ini文件。
    • 在文件中找到[mysqld]部分,如果没有则添加。
  2. 添加性能参数:

    • [mysqld]部分添加以下参数:
    • 添加前先查找一下,例如,如果已经存在,把原来的注释了:
key_buffer = 600M
table_cache = 300
sort_buffer_size = 500M
read_buffer_size = 200M
query_cache_limit = 3M
query_cache_size = 100M
myisam_sort_buffer_size = 200M
bulk_insert_buffer_size = 100M
join_buffer_size = 100M
  1. 保存并重启 MySQL 服务:
    • 保存my.ini文件。
    • 重启 MySQL 服务,可以通过以下方式进行:
      • 按下Win + R打开运行窗口,输入services.msc并回车。
      • 在服务列表中找到 “MySQL” 服务,右键选择 “重新启动”。

请注意,调整这些参数时要根据你的系统实际内存情况和工作负载进行合理设置,过大的参数设置可能会导致系统资源紧张,反而影响性能。同时,在生产环境中进行配置调整前,最好先在测试环境中进行验证。

  • key_buffer 参数将索引存储在内存中。此缓冲区应足够大以容纳所有索引。要分配 600MB 的缓冲区,请使用:

    key_buffer = 600M
  • table_cache 参数告知 MySQL 它可以同时打开多少个表。请确保此参数设置得不高,因为 MySQL 可能会用尽文件描述符并拒绝连接或无法执行查询。要分配 300 个缓存,请使用:

    table_cache = 300
  • sort_buffer_size 参数决定 MySQL 在返回数据之前需要占用多少内存区域来对数据进行排序。要分配 500MB 的缓冲区大小,请使用:

    sort_buffer_size = 500M
  • read_buffer_size 参数决定了每次连续扫描表时分配的内存量。要分配 200MB 的缓冲区大小,请使用:

    read_buffer_size = 200M
  • query_cache_limit 参数设置每个查询将被缓存的最大大小。如果查询结果超出查询缓存限制,则结果或数据将不会被缓存。默认为 1M。query_cache_limit

    = 3M
  • query_cache_size 参数设置查询缓存全局可用的内存量。随着数据库大小的增加,应向上调整此值。默认大小为 0,因此默认情况下禁用查询缓存。query_cache_size

    = 100M
  • myisam_sort_buffer_size 参数是用于在 myisam 表上创建索引的缓冲区大小。对于表加载,此设置很重要。要分配 200M 的缓冲区大小,请使用:

    myisam_sort_buffer_size = 200M
  • bulk_insert_buffer_size 参数可缓存批量插入的数据以提高性能。要分配大小为 100M 的缓冲区,请使用:

    bulk_insert_buffer_size = 100M
  • join_buffer_size 参数用于某些类型的非索引表连接。增加此参数的大小可使某些查询更快。要分配大小为 100M 的缓冲区,请使用:

    join_buffer_size = 100M

配置并运行加载脚本

视窗

如果您在 Windows 环境中运行 MetamorphoSys,则在输出目录中(在“输出选项”选项卡的“编写数据库加载脚本”部分中选择 MySQL 并运行 MetamorphoSys 后),您应该会看到一个名为“populate_mysql_db.bat”的批处理文件脚本。此脚本可用于将您的子集加载到 MySQL 数据库中。该目录还将包含用于创建表的 SQL 脚本和用于创建索引的 SQL 脚本。

编辑脚本并配置脚本顶部的四个参数。这些是:

设置 MYSQL_HOME=<MYSQL_HOME 路径>
设置用户=<用户名>
设置密码=<密码>
设置 db_name=<db_name>

MYSQL_HOME 应设置为本地 MySQL 服务器的安装目录。这可能类似于“C:\Program Files\MySQL\MySQL Server 5.5”。如果目录名称包含空格,请记住将值括在引号中。配置这四个参数后,脚本的这一部分可能如下所示:

设置 MYSQL_HOME="C:\Program Files\MySQL\MySQL Server 5.5"
设置用户=myuser
设置密码=p4ssw0rd
设置 db_name=umls

现在您可以运行该脚本了。为此,请使用 Windows 资源管理器导航到您的子集目录,然后双击刚刚编辑完成的“populate_mysql_db.bat”文件。

使用此脚本时请注意以下几点:

  1. 编写脚本时,需要本地安装 MySQL 服务器,并且您计划将 UMLS Metathesaurus 子集加载到由该本地服务器管理的数据库中。在此之前,您应该已经安装并配置了 MySQL 服务器。有关更多信息,请访问http://www.mysql.com
  2. 如果您的数据库配置为没有密码,您可以将密码设置留空,但您必须更新脚本“populate_mysql_db.bat”并删除对“-p%password%”参数的所有引用。因此,像这样的一行:

    %MYSQL_HOME%\bin\mysql -u %user% -p%password% --local-infile=1 %db_name% < mysql_tables.sql >> mysql.log 2>&1

    必须更改为此

    %MYSQL_HOME%\bin\mysql -u %user% --local-infile=1 %db_name% < mysql_tables.sql >> mysql.log 2>&1
  3. 该脚本将自动在与脚本相同的目录中创建一个名为“mysql.log”的日志文件。如果您计划多次运行该脚本,则应考虑在第二次运行之前重命名日志文件,否则第一次运行的内容将丢失。
  4. 脚本运行时,您可以使用“mysql> show processlist;”从 MySQL 命令 shell 中监视进程。
  5. 加载过程可能需要几个小时(特别是如果您选择了较大的子集)。加载完成后,将加载每个表,并创建一组初始索引。

Linux、Macintosh 或 Solaris

如果您在 Linux、Macintosh 或 Solaris 环境中运行 MetamorphoSys,则在输出目录中(在“输出选项”选项卡的“编写数据库加载脚本”部分中选择 MySQL 并运行 MetamorphoSys 后),您应该会看到一个名为“populate_mysql_db.sh”的 .sh shell 脚本。此脚本可用于将您的子集加载到 MySQL 数据库中。该目录还将包含用于创建表的 SQL 脚本和用于创建索引的 SQL 脚本。

编辑脚本并配置脚本顶部的四个参数。这些是:

MYSQL_HOME=<MYSQL_HOME 路径>
user=<用户名>
password=<密码>
db_name=<db_name>

MYSQL_HOME 应设置为本地 MySQL 服务器的安装目录。另一种思考方式是,MYSQL_HOME 的设置应包含一个包含“mysql”命令的 bin/ 目录。这甚至可能是“/usr”之类的目录。配置这四个参数后,脚本的这一部分可能如下所示。

MYSQL_HOME=/usr
用户=myuser
密码=p4ssw0rd
db_name=umls

现在您可以运行该脚本了。为此,请导航到您的子集目录并从命令行调用该脚本。可能需要更改文件权限以使脚本可执行,然后才能启动它。例如:

%cd <子集目录>
%chmod 775 populate_mysql_db.sh
%populate_mysql_db.sh&

使用此脚本时请注意以下几点:

  1. 编写脚本时,需要本地安装 MySQL 服务器,并且您计划将 UMLS Metathesaurus 子集加载到由该本地服务器管理的数据库中。在此之前,您应该已经安装并配置了 MySQL 服务器。有关更多信息,请访问http://www.mysql.com
  2. 如果您的数据库配置为没有密码,您可以将密码设置留空,但您必须更新脚本“populate_mysql_db.bat”并删除对“-p%password%”参数的所有引用。因此,像这样的一行:

    $MYSQL_HOME/bin/mysql -u $user -p$password $db_name < mysql_tables.sql >> mysql.log 2>&1

    必须更改为此

    $MYSQL_HOME/bin/mysql -u $user $db_name < mysql_tables.sql >> mysql.log 2>&1
  3. 该脚本将自动在与脚本相同的目录中创建一个名为“mysql.log”的日志文件。如果您计划多次运行该脚本,则应考虑在第二次运行之前重命名日志文件,否则第一次运行的内容将丢失。
  4. 脚本运行时,您可以使用“mysql> show processlist;”从 MySQL 命令 shell 中监视进程。
  5. 加载过程可能需要几个小时(特别是如果您选择了较大的子集)。加载完成后,将加载每个表,并创建一组初始索引。

示例查询(常用SQL语句都编好了)

可以从UMLS 数据库查询图网页获取示例查询。

4.我的安装过程

根据视频,先新建一个文件夹

配置刚才的文件夹:

2.出现这个界面点不动,

点个help看看

再点开一个键看看

点第一个按钮会出现和上面一样的提示,选accept之后,选第一个子集,这个包含的比较大

此时这里打了一个勾,因此这应该是要我们一个个做任务

弹出下一个窗口:

选择数据格式,官方说第一次安装只能选NLM

第二个选项保证输出格式是RRF,这是UMLS官方推荐输出

第三个是过滤资源,选框包括排除或包含所选内容(蓝色部分)

这里我想保留中文相关内容,操作如下

按住ctrl加选chinese

其它配置确定后,点file,save配置

起个名字

保存后开始子集

等待安装直到最后的Done被框选,这个时间蛮久的,建议晚上搞

成功后会生成META文件夹,可以看见log记录,META里面的RRF文件就是UMLS官方文档提到的各种原始文件了

再次打开软件,运行子集

选META,就可以使用sys的界面搜索啦

接下来我们看看怎么导入MYSQL

这里是mysql脚本相关内容

UMLS - Rich Release Format MySQL Load Script

上述教程的翻译如下:

丰富的发布格式 MySQL 加载脚本

本文档是使用 MetamorphoSys 创建的脚本和文件将 UMLS Metathesaurus 的 RRF 子集加载到 MySQL 数据库的指南。要在创建子集时生成必要的文件和脚本,请在“输出选项”选项卡的“写入数据库加载脚本”部分中选择 MySQL 数据库。您也可以在创建子集后生成这些文件:从 MetamorphoSys 欢迎屏幕中选择“高级”,然后选择“将数据库加载脚本复制到硬盘”。

推荐软件版本:MySQL Server 5.5

使用 MySQL 5.6 版本的 MySQL 用户请注意:

MySQL 5.6 及以上版本默认使用 InnoDB 存储引擎。用户报告称,在将 RRF 数据加载到 MySQL 5.6 数据库时,由于默认的 InnoDB 设置将所有表和索引存储在系统表空间中,因此会出现磁盘空间问题。MySQL 5.6.6 现在将“innodb_file_per_table”配置设置设置为“ON”,以便为每个新创建的表和索引分配一个单独的 .idb 数据文件。用户应阅读MySQL 文档以获取更多信息。

创建数据库

为了将子集加载到 MySQL 数据库中,您必须使用现有数据库或创建新数据库。创建 MySQL 数据库时需要考虑两个重要事项,即默认字符集和排序规则设置。我们建议使用 UTF8 和 utf8_unicode_ci 排序规则设置。例如:

如果不存在则创建数据库umls 字符集utf8 COLLATE utf8_unicode_ci;

配置性能参数

为了优化读取性能,MySQL 5.5 服务器需要更改缓冲区大小以利用可用内存。每个参数都取决于每台服务器上的内存量,并且应在 my.cnf 或 my.ini 文件中适当调整大小

  • key_buffer 参数将索引存储在内存中。此缓冲区应足够大以容纳所有索引。要分配 600MB 的缓冲区,请使用:

    key_buffer = 600M
  • table_cache 参数告知 MySQL 它可以同时打开多少个表。请确保此参数设置得不高,因为 MySQL 可能会用尽文件描述符并拒绝连接或无法执行查询。要分配 300 个缓存,请使用:

    table_cache = 300
  • sort_buffer_size 参数决定 MySQL 在返回数据之前需要占用多少内存区域来对数据进行排序。要分配 500MB 的缓冲区大小,请使用:

    sort_buffer_size = 500M
  • read_buffer_size 参数决定了每次连续扫描表时分配的内存量。要分配 200MB 的缓冲区大小,请使用:

    read_buffer_size = 200M
  • query_cache_limit 参数设置每个查询将被缓存的最大大小。如果查询结果超出查询缓存限制,则结果或数据将不会被缓存。默认为 1M。query_cache_limit

    = 3M
  • query_cache_size 参数设置查询缓存全局可用的内存量。随着数据库大小的增加,应向上调整此值。默认大小为 0,因此默认情况下禁用查询缓存。query_cache_size

    = 100M
  • myisam_sort_buffer_size 参数是用于在 myisam 表上创建索引的缓冲区大小。对于表加载,此设置很重要。要分配 200M 的缓冲区大小,请使用:

    myisam_sort_buffer_size = 200M
  • bulk_insert_buffer_size 参数可缓存批量插入的数据以提高性能。要分配大小为 100M 的缓冲区,请使用:

    bulk_insert_buffer_size = 100M
  • join_buffer_size 参数用于某些类型的非索引表连接。增加此参数的大小可使某些查询更快。要分配大小为 100M 的缓冲区,请使用:

    join_buffer_size = 100M

配置并运行加载脚本

视窗

如果您在 Windows 环境中运行 MetamorphoSys,则在输出目录中(在“输出选项”选项卡的“编写数据库加载脚本”部分中选择 MySQL 并运行 MetamorphoSys 后),您应该会看到一个名为“populate_mysql_db.bat”的批处理文件脚本。此脚本可用于将您的子集加载到 MySQL 数据库中。该目录还将包含用于创建表的 SQL 脚本和用于创建索引的 SQL 脚本。

编辑脚本并配置脚本顶部的四个参数。这些是:

设置 MYSQL_HOME=<MYSQL_HOME 路径>
设置用户=<用户名>
设置密码=<密码>
设置 db_name=<db_name>

MYSQL_HOME 应设置为本地 MySQL 服务器的安装目录。这可能类似于“C:\Program Files\MySQL\MySQL Server 5.5”。如果目录名称包含空格,请记住将值括在引号中。配置这四个参数后,脚本的这一部分可能如下所示:

设置 MYSQL_HOME="C:\Program Files\MySQL\MySQL Server 5.5"
设置用户=myuser
设置密码=p4ssw0rd
设置 db_name=umls

现在您可以运行该脚本了。为此,请使用 Windows 资源管理器导航到您的子集目录,然后双击刚刚编辑完成的“populate_mysql_db.bat”文件。

使用此脚本时请注意以下几点:

  1. 编写脚本时,需要本地安装 MySQL 服务器,并且您计划将 UMLS Metathesaurus 子集加载到由该本地服务器管理的数据库中。在此之前,您应该已经安装并配置了 MySQL 服务器。有关更多信息,请访问http://www.mysql.com
  2. 如果您的数据库配置为没有密码,您可以将密码设置留空,但您必须更新脚本“populate_mysql_db.bat”并删除对“-p%password%”参数的所有引用。因此,像这样的一行:

    %MYSQL_HOME%\bin\mysql -u %user% -p%password% --local-infile=1 %db_name% < mysql_tables.sql >> mysql.log 2>&1

    必须更改为此

    %MYSQL_HOME%\bin\mysql -u %user% --local-infile=1 %db_name% < mysql_tables.sql >> mysql.log 2>&1
  3. 该脚本将自动在与脚本相同的目录中创建一个名为“mysql.log”的日志文件。如果您计划多次运行该脚本,则应考虑在第二次运行之前重命名日志文件,否则第一次运行的内容将丢失

  1. 脚本运行时,您可以使用“mysql> show processlist;”从 MySQL 命令 shell 中监视进程。
  2. 加载过程可能需要几个小时(特别是如果您选择了较大的子集)。加载完成后,将加载每个表,并创建一组初始索引。

Linux、Macintosh 或 Solaris

如果您在 Linux、Macintosh 或 Solaris 环境中运行 MetamorphoSys,则在输出目录中(在“输出选项”选项卡的“编写数据库加载脚本”部分中选择 MySQL 并运行 MetamorphoSys 后),您应该会看到一个名为“populate_mysql_db.sh”的 .sh shell 脚本。此脚本可用于将您的子集加载到 MySQL 数据库中。该目录还将包含用于创建表的 SQL 脚本和用于创建索引的 SQL 脚本。

编辑脚本并配置脚本顶部的四个参数。这些是:

MYSQL_HOME=<MYSQL_HOME 路径>
user=<用户名>
password=<密码>
db_name=<db_name>

MYSQL_HOME 应设置为本地 MySQL 服务器的安装目录。另一种思考方式是,MYSQL_HOME 的设置应包含一个包含“mysql”命令的 bin/ 目录。这甚至可能是“/usr”之类的目录。配置这四个参数后,脚本的这一部分可能如下所示。

MYSQL_HOME=/usr
用户=myuser
密码=p4ssw0rd
db_name=umls

现在您可以运行该脚本了。为此,请导航到您的子集目录并从命令行调用该脚本。可能需要更改文件权限以使脚本可执行,然后才能启动它。例如:

%cd <子集目录>
%chmod 775 populate_mysql_db.sh
%populate_mysql_db.sh&

使用此脚本时请注意以下几点:

  1. 编写脚本时,需要本地安装 MySQL 服务器,并且您计划将 UMLS Metathesaurus 子集加载到由该本地服务器管理的数据库中。在此之前,您应该已经安装并配置了 MySQL 服务器。有关更多信息,请访问http://www.mysql.com
  2. 如果您的数据库配置为没有密码,您可以将密码设置留空,但您必须更新脚本“populate_mysql_db.bat”并删除对“-p%password%”参数的所有引用。因此,像这样的一行:

    $MYSQL_HOME/bin/mysql -u $user -p$password $db_name < mysql_tables.sql >> mysql.log 2>&1

    必须更改为此

    $MYSQL_HOME/bin/mysql -u $user $db_name < mysql_tables.sql >> mysql.log 2>&1
  3. 该脚本将自动在与脚本相同的目录中创建一个名为“mysql.log”的日志文件。如果您计划多次运行该脚本,则应考虑在第二次运行之前重命名日志文件,否则第一次运行的内容将丢失。
  4. 脚本运行时,您可以使用“mysql> show processlist;”从 MySQL 命令 shell 中监视进程。
  5. 加载过程可能需要几个小时(特别是如果您选择了较大的子集)。加载完成后,将加载每个表,并创建一组初始索引。

示例查询

可以从UMLS 数据库查询图网页获取示例查询。

由于脚本在创建表时就会报错,在阅读后尝试手动操作,

直接运行sql报语法错误,逐条运行其中的sql

这一句要修改文件路径为绝对路径

执行下一句,时间巨长,不用担心文件本来九大。这里要注意本地的mysql对应的磁盘最好要有50G以上的富余。

总之一句句创建能确保及时定位错误,就是比较花时间,但是也能帮我们逐行理解sql,选择需要的表,目前是我已经导入的表,表的内容可以结合UMLS官网对RRF文件的介绍来理解

那么对数据库的探索再加几个sql查询示例就结束了,后续我们来看看QuickStart与使用api的效果:

这里我在思考mysql5.6和最新版能不能兼容,需要查一下,再安装mysql,以免脚本不可用,以下是之前的安装配置,检查过后发现不兼容,还是乖乖使用mysql5.6吧,参考以下教程。官方教程建议装5.6.6及以上版本,以免出现磁盘问题:

安装前注意,如果电脑上已经有mysql了,建议卸载干净了再装新的​​,卸载链接如下:

【Windows10 彻底卸载 MySQL - CSDN App】http://t.csdnimg.cn/uQJMyz

卸载完成后需要重启才能再次安装

MySQL5.6下载安装、配置环境变量教程(官网)-CSDN博客

MYSQL官网:MySQL

安装好后在mysql中使用sql语句新建名为umls的数据库。

CREATE DATABASE umls;

激活数据库,再次连接

USE umls;

还是报错,猜测是jdbc驱动没装,驱动可以装5.1.48,5.1的都行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值