LSTM+CRF Pytorch tutorial 之从原理到代码 # 摸着石头入门系列

最新推荐文章于 2023-10-19 11:15:53 发布

菜鸟的后院

最新推荐文章于 2023-10-19 11:15:53 发布

阅读量504

点赞数

分类专栏： NLP NER

本文链接：https://blog.csdn.net/u014007701/article/details/106092941

版权

本文是针对Pytorch中LSTM+CRF模型的命名体识别（NER）教程，旨在帮助初学者从原理到代码全面理解模型。介绍了模型用途，包括输入序列的实体识别，以及模型的结构：词向量输入层通过Embedding将非结构化数据转换为词向量，Bi-LSTM层用于特征提取，CRF层则负责序列标注。

摘要由CSDN通过智能技术生成

Pytorch 给出的命名体识别（NER）的小例子，简洁清晰，深入原理及实现细节，比较适合想深入学习又没有好的入门途径的同学。不过他过于简洁，一些理论背景没有介绍，对于咱们这些，在门口晃悠的渣渣掌握起来还是有点儿费劲。

所以，本文打算总结自己的学习过程，从原理到代码，走一遍这个小例子，算是摸着石头入门吧~

outline：

这个模型的用途
模型的结构
几个关键代码的原理

1、模型用途

输入是一句话，或者更严谨一点说是一个多个词（单词）组成的自然序列，然后这个模型其中的实体（比如人名，地名，组织机构名等）识别出来。

比如输入：我爱北京

模型给出标记：O O B-LOC I-LOC

我	O	其他
爱	O	其他
北	B

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

菜鸟的后院

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pytorch lstm crf 代码理解

Jason__Liang的博客

08-17

1万+

好久没有写博客了，这一次就将最近看的pytorch 教程中的lstm+crf的一些心得与困惑记录下来。原文 PyTorch Tutorials 参考了很多其他大神的博客，https://blog.csdn.net/cuihuijun1hao/article/details/79405740 https://www.jianshu.com/p/97cb3b6db573 至于原理，非常建议...

lstm-crf-pytorch:PyTorch中的LSTM-CRF

05-24

PyTorch中的LSTM-CRF 用于序列标记的双向LSTM-CRF的最小PyTorch（1.7.1）实现。支持的功能： CUDA的小批量培训嵌入层中的查找，CNN，RNN和/或自我关注分层递归编码（HRE）条件随机场（CRF）的PyTorch实现 CRF损失的矢量化计算矢量化维特比解码用法培训数据的格式应如下： token/tag token/tag token/tag ... token/tag token/tag token/tag ... ... 有关更多详细信息，请参见每个子目录中的README.md。准备数据： python3 prepare.py training_data 训练： python3 train.py model char_to_idx word_to_idx tag_to_idx training_data.csv (v

3 条评论您还未登录，请先登录后发表或查看评论

NER-pytorch：LSTM + CRF NER

02-03

注意：该软件包已停止更新，请参阅我们的新参考：纸：用于命名实体识别的神经架构通过BLSTM-CNN-CRF进行端到端序列标记码：用法： python train.py 性能 f1 91.00％

LSTM-CRF模型详解和Pytorch代码实现

最新发布

deephub

10-19

4591

在过去，CRF-LSTM模型已被广泛用于序列标记任务，但与最近的Transformer模型相比，它们也存在一定的缺点。一个重要的缺点是，CRF-LSTM不擅长对序列元素之间的长期依赖关系进行建模，而倾向于更好地处理局部上下文。这与transformer的情况不同，因为它们的自注意力机制能够捕获远程依赖关系，擅长建模全局上下文CRF-LSTM模型的另一个问题是它们顺序处理序列，这限制了并行化，并且对于长序列可能很慢，而transformer并行处理序列，因此通常更快。

bi-lstm-crf:BI-LSTM-CRF模型的PyTorch实现

05-07

BI-LSTM-CRF模型的PyTorch实现。特征：与相比，执行了以下改进：全面支持小批量计算完全矢量化的实现。特别是，删除了“得分句”算法中的所有循环，从而极大地提高了训练效果支持CUDA 用于非常简单的API START / STOP标签会自动添加到CRF中包含一个内部线性层，该线性层可从要素空间转换为标签空间专门用于NLP序列标记任务轻松训练自己的序列标记模型麻省理工学院执照安装依存关系的Python 3 安装$ pip install bi-lstm-crf 训练语料库以指定的准备语料库也有一个示例语料库训练 $ python -m bi_lstm_crf corpus_dir --model_dir " model_xxx " 更多训练曲线 import pandas as pd import matplotlib . pyplot

零基础入门--中文命名实体识别（BiLSTM+CRF模型，含代码）

03-15

4万+

自己也是一个初学者，主要是总结一下最近的学习，大佬见笑。中文分词说到命名实体抽取，先要了解一下基于字标注的中文分词。比如一句话 “我爱北京天安门”。分词的结果可以是 “我/爱/北京/天安门”。那什么是基于字标注呢？ “我/O 爱/O 北/B 京/E 天/B 安/M 门/E”。就是这样，给每个字都进行一个标注。我们可以发现这句话中字的标注一共...

PyTorch tutorial - BiLSTM CRF 代码解析

Ono_online的博客

03-25

1062

本文主要对PyTorch的tutorial之一，Advanced: Making Dynamic Decisions and the Bi-LSTM CRF，进行详细解读，行文顺序上，首先说明一下前面几个辅助函数的作用，然后主体按照Run training的运行顺序进行。(以下删除了原代码注释，可回tutorial中查看) def argmax(vec): _, idx = torch.m...

序列标注之Bi-LSTM-CRF

real_ilin的博客

03-05

2896

文章目录Bi-LSTM-CRF1. 模型原理1.1 CRF原理2. 模型实现2.1 tensorflow实现2.2 pytorch实现 Bi-LSTM-CRF 1. 模型原理 1.1 CRF原理 2. 模型实现 2.1 tensorflow实现 2.2 pytorch实现 ...

NER-LSTM-CNN-Pytorch:通过双向LSTM-CNNs-CRF教程进行端到端序列标签

05-01

通过双向LSTM-CNNs-CRF教程进行端到端序列标签这是针对ACL'16论文的PyTorch教程该存储库包括资料夹设置说明文件预训练模型目录（笔记本电脑将根据需要自动将预训练模型下载到此目录中）作者安装最好的...

LSTM+CRF模型项目完整代码

12-20

LSTM+CRF模型项目完整代码

pytorch_lstmcrf:LSTM-CRF的Pytorch实现以实现命名实体识别

05-17

用于命名实体识别（或序列标记）的LSTM-CRF模型该存储库实现了用于命名实体识别的LSTM-CRF模型。该模型与的模型相同，只是我们没有BiLSTM之后的最后一个tanh层。我们在CoNLL-2003和OntoNotes 5.0英文数据集上均达到了SOTA性能（请通过使用Glove和ELMo来检查我们的，通过对BERT进行微调来检查其他）。公告内容我们实现了模块，该模块允许O（log N）推断和回溯！通过微调BERT / Roberta **获得模型数据集精确记起 F1 基于BERT的情况+ CRF（此存储库） CONLL-2003 91.69 92.05 91.87 Roberta-base + CRF（此仓库） 2003年 91.88 93.01 92.44 基于BERT的情况+ CRF（此存储库）笔记5 89.57 89.45

lstm+crf、bilstm+crf 、LSTM CRF pytorch 命名实体识别代码

04-21

pytorch lstm+crf、bilstm+crf 、LSTM CRF 命名实体识别代码代码和数据可以直接运行

Pytorch Bi-LSTM + CRF 代码详解