深入了解中文标点预测算法（一）

嗷呜酱

于 2020-06-20 21:02:31 发布

阅读量2.5k

点赞数

分类专栏：项目实训记录日志文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39898307/article/details/106877409

版权

本文深入探讨中文标点预测算法，包括直接应用BERT模型，BERT模型结合微调，以及采用BiGRU+Attention机制的方法。通过分析论文和开源项目，阐述了不同模型的工作原理和实现细节。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目前查找到的算法大多基于bert模型，对于bert模型进行微调，由于BERT论文中提供了序列标注的思路，所以单纯使用原论文的bert模型跑一下就可以得到比较满意的结果，目前我查找到的几个思路：

1、使用原论文中的bert模型

论文：
BERT：Pre-training of Deep Bidirectional Transformer for Language Understanding

2、使用bert模型+微调

项目：入口

思想：
在预训练的BERT掩码语言模型（BertForMaskedLM）的顶部添加了一个额外的线性层。BertForMaskedLM为每个（掩码）令牌输出一个logit向量。logit向量的大小为30522，与BERT token词汇表相对应。额外的线性层映射到可能的标点符号（比如：逗号，句点，问号和无标点）。

3、BiGRU+Attention

论文：
Bidirectional Recurrent Neural Network with Attention Mechanism for Punctuation Restoration

github：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。