论文复现_1：Chinese NER Using Lattice LSTM

最新推荐文章于 2024-07-19 14:39:32 发布

YingJingh

最新推荐文章于 2024-07-19 14:39:32 发布

阅读量613

点赞数

分类专栏：论文复现记录文章标签： lstm 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hekena/article/details/127275982

版权

论文复现记录专栏收录该内容

35 篇文章 2 订阅

订阅专栏

论文重新读。
gate recurrent cell:门控递归单元使我们的模型能够从一个句子中选择最相关的字符和单词，以获得更好的NER结果。

Lattice LSTM:格子LSTM

实体识别可以看为两个过程：实体边界识别和实体的类型分类任务。
关系分类也是包含两个任务的呀，关系的实体头识别和实体头类型的分类任务。

词典融入的问题：
我们通过使用晶格结构的LSTM来表示句子中的词汇，从而将潜在的词汇信息整合到基于特征的LSTM-CRF中。
latent：晶格结构
lexicon：词汇表
网络模型：LSTM-CRF,使用LSTM的目的是为了建模时序信息。

所以是为每一个句子设计一个lstm模型吗？——文中提到是一个dynamic route。
gated cells are used to dynamically route information from different paths to each character.

构建Word的晶格结构，通过匹配一个句子序列以自动获得的词典。
character-lattice，用的是auto-matically obtained lexicon

在这里插入图片描述

s = c1, c2, . . . , cm, where cj denotes the jth character. s can further be seen as a word sequence s = w1, w2, . . . , wn

wi表示的句子中的Word，对于句子找那个的第i个Word，采用t(j,k)表示句子中第j个位置的k个charcter.
南京市|长江大桥
南京市：t(1,1)-南
t(1,2)-京
t(1,3)-市
t(2,1)-长

每个character的embedding的获取是采用bi-directional LSTM得到的。将正反向的embedding拼接作为char的embedding .

所以，论文中表示bi-grams信息的时候，是将char和bi-gram做的拼接，而bi-grams的信息是在look-uplabel中找到的。

除了bi-grams之外的信息，还添加了word-segmentation的信息，而单词分区的信息查找是通过look-up table查询的。
e s代表一个分割标签嵌入查询表

所以，每个charcter拼接的信息，除了character自身额信息外，还拼接了character的bi-grams信息，还有character的可能词的信息。

在计算的时候，是在bi-lstm的cell信息计算时，将cell信息做了丰富。

这是在basic的LSTM计算的公式：
在cell的信息计算时，考虑cell的上一个时序信息和当前cell的信息。

在这里插入图片描述

然后，文中的LSTM在计算的时候的公式是：
Word cell的计算时c_be_w
融合character的cell的计算时采用权重分配，
在cell计算中，考虑了所有相同结尾的词的信息的拼接。

在这里插入图片描述
解码：维特比解码。一阶维特比解码方式。参数好像是有beam_size。
first-order Viterbi algorithm
损失函数：L2正则方式。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
论文复现_1：Chinese NER Using Lattice LSTM

除了bi-grams之外的信息，还添加了word-segmentation的信息，而单词分区的信息查找是通过look-up table查询的。的时候，是将char和bi-gram做的拼接，而bi-grams的信息是在look-uplabel中找到的。我们通过使用晶格结构的LSTM来表示句子中的词汇，从而将潜在的词汇信息整合到基于特征的LSTM-CRF中。在计算的时候，是在bi-lstm的cell信息计算时，将cell信息做了丰富。在cell的信息计算时，考虑cell的上一个时序信息和当前cell的信息。
复制链接

扫一扫

专栏目录

YingJingh CSDN认证博客专家 CSDN认证企业博客

码龄4年

343: 原创

2万+: 周排名

8615: 总排名

25万+: 访问

: 等级

4108: 积分

1990: 粉丝

211: 获赞

49: 评论

681: 收藏

私信

关注

热门文章

分类专栏

最新评论

word中避免无引用源的方法
hx0520: 摸索了一下mac系统锁定域,按command+fn+f11
PDF相关的处理操作
haakaa: csdn这段确实好用
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
小阳不一样666666: 请问作者你复现成功了嘛？我按照论文设置超参数，但是对于ace2005效果只有0.84没有论文的0.86，这是我设置的情况：--task_type=ner --task_save_name=ner111 --data_dir=./data/ace2005 --data_name=ace2005 --model_name_or_path=D:/YangCode/data/bert-large-cased --model_name=SERS --output_dir=./outmodel --result_dir=./result --do_lower_case=False --first_label_file=./data/ace2005/processed/label_map.json --train_set=./data/ace2005/processed/train.json --dev_set=./data/ace2005/processed/dev.json --test_set=./data/ace2005/processed/test.json --label_str_file=./data/ace2005/processed/label_annotation.txt --overwrite_output_dir=True --exist_nested=True --do_train=True --is_chinese=False --val_step=20 --use_attn=True --seed=42 --max_seq_length=128 --dropout_rate=0.1 --learning_rate=3e-5 --task_layer_lr=2 --num_train_epochs=20能帮忙看看问题所在嘛？
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
YingJingh: 那得看你的环境和论文中的环境一不一致
EMNLP-21-Enhanced Language Representation with Label Knowledge for Span Extraction-NER-融入label knowl
小阳不一样666666: 你好，请问这个代码你运行起来了嘛？能咨询你一下嘛？

大家在看

ROS话题实战【非常有用】 189

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

YingJingh 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。