实习点滴（7）--《Investigating LSTM for Punctuation Prediction》论文笔记

最新推荐文章于 2020-08-07 15:05:40 发布

四海龙王Black

最新推荐文章于 2020-08-07 15:05:40 发布

阅读量1.1k

点赞数

分类专栏：实习点滴记录文章标签：自然语言处理标点符号 LSTM CRF

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sihailongwang/article/details/76147065

版权

实习点滴记录专栏收录该内容

10 篇文章 1 订阅

订阅专栏

原文地址：http://lxie.nwpu-aslp.org/papers/2016ISCSLP-XKT.pdf

本文是利用BiLstm（双向Lstm）+CRF模型，对词组间的标点符号进行预测。

作者首先强调了，递归神经网络(RNN)及其变体在各种序列标签的任务已经显示出优越的性能，例如词性(POS)标签,分块和命名实体识别，韵律边界预测和语言理解。标点符号预测可以被看作是一个典型的序列标签任务。与此同时，作者认为，如果两个都是过去和未来的上下文考虑，标点符号标记更准确；使用一个条件随机域(CRF)层的Lstm可以捕获输出上下文信息,也会有一些性能上的提升。

BiLstm最大的优点在于：它不仅可以利用上一个的信息，还可以利用下一个的信息。

所做的贡献：

1)建议使用双向LSTM(BLSTM)和深度网络架构考虑过去和未来的输入以及模型输入特性和输出标签之间的复杂关系。
2)调查的上下文建模是否输出标点标签,通过CRF层,可以实现对标点符号的预测性能,如预期的那样在其他序列标签的任务。
3)通过研究，得出一个结论：一个2层BLSTM模型可以在标点符号生产最先进的性能预测

模型结构：

算法流程：

对于每个epoch循环：

对于每个batch循环：

(1)BiLstm-CRF正向传播

(2)CRF正向传播

(3)BiLstm-CRF反向传播

(4)更新参数

结束循环batch

结束循环epoch

实验需注意的事项：

(1)在输入前，进行了数据预处理：把问号、感叹号换成句号；把冒号、分号换成逗号（相当于只预测不打标点、逗号和句号三种情况），其他的符号均删除

(2)输入是一句话（经过分词之后的）和这句话中每个词语前的标点符号的label

(3)他们采用的是Mecab-toolkit工具进行分词的

实验结果：

四海龙王Black

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。