中文命名实体识别（ner）迁移学习

最新推荐文章于 2024-05-05 23:16:55 发布

什么都干的派森

最新推荐文章于 2024-05-05 23:16:55 发布

阅读量6.7k

点赞数 11

分类专栏： NLP 文章标签：自然语言处理深度学习

本文链接：https://blog.csdn.net/weixin_43721000/article/details/119993664

版权

NLP 专栏收录该内容

20 篇文章 1 订阅

订阅专栏

文章目录

1.首先将中文ner项目克隆到本地
2.去ALBERT下载中文模型
3.安装gpu运行环境
4.配置虚拟环境
5.创建命令执行脚本
6.补充说明

1.首先将中文ner项目克隆到本地

项目地址：https://github.com/ProHiryu/albert-chinese-ner
在这里插入图片描述

2.去ALBERT下载中文模型

地址：https://github.com/brightmart/albert_zh
在这里插入图片描述
解压后放入项目下新建的 albert_base_zh 文件夹中

3.安装gpu运行环境

建议使用tensorflow1.15.5，因此需要下载并安装cuda10.0 和 cudnn7.6（如果没有显卡的话不用安装这两个）

4.配置虚拟环境

# gpu训练
pip install tensorflow-gpu==1.15.5

# 没有显卡安装这个
pip install tensorflow==1.15.5

5.创建命令执行脚本

目录下新建run.py文件，内容如下

import os

cmd = ' '.join([
    'python albert_ner.py',
    '--task_name ner',
    '--do_train true',           # 训练
    '--do_eval true',			 # 评估
    # '--do_predict true',       # 预测
    '--data_dir data',
    '--vocab_file ./albert_config/vocab.txt',
    '--bert_config_file ./albert_base_zh/albert_config_base.json',
    '--max_seq_length 128',
    '--train_batch_size 16',
    '--learning_rate 2e-5',
    '--num_train_epochs 3',
    '--output_dir albert_base_ner_checkpoints'
])

os.system(cmd)

先注释掉预测，执行训练、评估，
然后再注释掉训练、评估，进行预测就好了

6.补充说明

1.dev.txt是待评估文件
train.txt是待训练文件
test,txt是待预测文件
在这里插入图片描述

2.预测结果在label_test.txt中
在这里插入图片描述

3.项目来自 github，贡献者如下
在这里插入图片描述

什么都干的派森

关注

11
点赞
踩
28

收藏

觉得还不错? 一键收藏
打赏
3
评论
中文命名实体识别（ner）迁移学习

文章目录1.首先将中文ner项目克隆到本地2.去ALBERT下载中文模型3.安装gpu运行环境4.配置虚拟环境5.创建命令执行脚本6.补充说明1.首先将中文ner项目克隆到本地项目地址：https://github.com/ProHiryu/albert-chinese-ner2.去ALBERT下载中文模型地址：https://github.com/brightmart/albert_zh解压后放入项目下新建的 albert_base_zh 文件夹中3.安装gpu运行环境建议使用tens
复制链接

扫一扫