中文命名实体识别(ner)迁移学习

1.首先将中文ner项目克隆到本地

项目地址:https://github.com/ProHiryu/albert-chinese-ner
在这里插入图片描述

2.去ALBERT下载中文模型

地址:https://github.com/brightmart/albert_zh
在这里插入图片描述
解压后放入项目下新建的 albert_base_zh 文件夹中
在这里插入图片描述

3.安装gpu运行环境

建议使用tensorflow1.15.5,因此需要下载并安装cuda10.0 和 cudnn7.6(如果没有显卡的话不用安装这两个)

4.配置虚拟环境

# gpu训练
pip install tensorflow-gpu==1.15.5

# 没有显卡安装这个
pip install tensorflow==1.15.5

5.创建命令执行脚本

目录下新建run.py文件,内容如下

import os

cmd = ' '.join([
    'python albert_ner.py',
    '--task_name ner',
    '--do_train true',           # 训练
    '--do_eval true',			 # 评估
    # '--do_predict true',       # 预测
    '--data_dir data',
    '--vocab_file ./albert_config/vocab.txt',
    '--bert_config_file ./albert_base_zh/albert_config_base.json',
    '--max_seq_length 128',
    '--train_batch_size 16',
    '--learning_rate 2e-5',
    '--num_train_epochs 3',
    '--output_dir albert_base_ner_checkpoints'
])

os.system(cmd)

先注释掉预测,执行训练、评估,
然后再注释掉训练、评估,进行预测就好了

6.补充说明

1.dev.txt是待评估文件
train.txt是待训练文件
test,txt是待预测文件
在这里插入图片描述

2.预测结果在label_test.txt中
在这里插入图片描述

3.项目来自 github,贡献者如下
在这里插入图片描述

  • 11
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
迁移学习是指将从一个任务中学到的知识应用到另一个相关任务中的机器学习方法。基于样本的迁移学习方法是其中一种常见的方法。它通过利用源领域和目标领域之间的样本数据来进行知识迁移。 基于样本的迁移学习方法主要包括以下几种: 1. 领域自适应(Domain Adaptation):源领域和目标领域具有不同的数据分布,但是它们之间存在一定的相似性。领域自适应方法通过对源领域和目标领域的数据进行特征转换或者对抗训练等方式,使得目标领域的数据能够更好地适应源领域的模型。 2. 迁移度量学习(Transfer Metric Learning):源领域和目标领域之间的数据可能存在不同的度量空间,导致模型在目标领域上表现不佳。迁移度量学习方法通过学习一个适应性的度量函数,将源领域和目标领域的数据映射到同一度量空间,从而提高模型在目标领域上的性能。 3. 迁移聚类(Transfer Clustering):源领域和目标领域的数据可能存在不同的聚类结构,导致在目标领域上难以进行有效的聚类。迁移聚类方法通过利用源领域的聚类信息,辅助目标领域的聚类过程,从而提高目标领域上的聚类性能。 4. 迁移生成模型(Transfer Generative Models):源领域和目标领域之间的数据可能存在差异,导致在目标领域上难以生成真实的样本。迁移生成模型通过学习一个生成模型,将源领域的数据转化为目标领域的数据分布,从而生成逼近目标领域的样本。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

什么都干的派森

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值