TPLinker-NER 开源项目使用教程-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00828/article/details/142081336

TPLinker-NER 开源项目使用教程

TPLinker-NERTPlinker for NER 中文/英文命名实体识别项目地址:https://gitcode.com/gh_mirrors/tp/TPLinker-NER

1. 项目介绍

TPLinker-NER 是一个基于 TPLinker 模型的命名实体识别（NER）工具，专门用于中文和英文的命名实体识别任务。TPLinker 最初是为关系抽取（RE）设计的，但在此项目中，它被修改为适用于命名实体识别任务。TPLinker-NER 有效地解决了实体嵌套问题，并在 CLUENER 数据集上取得了优异的 F1 分数（0.9111）。

2. 项目快速启动

环境准备

确保你的 Python 版本为 3.6，并安装以下主要第三方库：

pip install pytorch==1.8.1 wandb==0.10.26 glove-python-binary==0.1.0 transformers==4.1.1 tqdm==4.54.1

克隆项目

git clone https://github.com/gaohongkui/TPLinker-NER.git
cd TPLinker-NER

数据准备

TPLinker-NER 要求数据集的格式如下：

[
  {
    "id": "",
    "text": "原始语句",
    "entity_list": [
      {
        "text": "实体",
        "type": "实体类型",
        "char_span": "实体char级别的span",
        "token_span": "实体token级别的span"
      }
    ]
  }
]