独家 | 轻松上手，通过微调Transformers完成命名实体识别任务

最新推荐文章于 2024-08-09 11:52:45 发布

数据派THU

最新推荐文章于 2024-08-09 11:52:45 发布

阅读量2.1k

点赞数 1

文章标签：人工智能大数据编程语言机器学习 java

本文链接：https://blog.csdn.net/tmb8z9vdm66wh68vx1/article/details/115364515

版权

本文介绍如何通过微调预训练的transformer，特别是BERT，完成任意语言的命名实体识别（NER）任务。使用python的NERDA包，即使在计算资源有限的情况下，也能实现高效微调。NERDA是一个通用的NER系统，支持对任意transformer进行最少代码量的微调。

摘要由CSDN通过智能技术生成



作者：Lars Kjeldgaard
翻译：王闯（Chuck）校对：和中华

本文约2500字，建议阅读7分钟本文基于丹麦团队研发的Python开源包NERDA演示了如何通过简单微调BERT Transformer来处理NER任务。

照片源自Pixabay，作者vinsky2002

在本文中，我们将介绍如何通过简单微调（fine-tune）任意预训练的（pretrained）自然语言处理transformer，来完成任意语言中的命名实体识别（Named-Entity Recognition, NER）任务。

为什么这个话题值得你关注？因为NER是一项强大的自然语言处理任务，在诸多领域都有实际应用，在Towards Data Science之前的帖子中已有详细介绍。然而要想得到不错的NER模型效果，通常需要基于预训练的transformer对NER模型进行特定语言或领域的微调，这在计算资源有限的情况下，是比较可行的办法，而且能看到实际效果。

为了展示如何做到，我们使用python的NERDA包调用BERT transformer对NER模型进行微调。

NERDA是一套通用的NER系统，可用于以最少的代码量对任意语言的NER任务和任意transformer进行微调。