BERT预训练技巧

最新推荐文章于 2024-04-10 17:50:49 发布

有梦想有行动

最新推荐文章于 2024-04-10 17:50:49 发布

阅读量1k

点赞数

文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CSDN_of_ding/article/details/107577160

版权

使用BERT预训练模型进行自然语言的情感分类之BERT预训练技巧

1. 因为我们是按单个字为单位训练BERT，所以在Masked LM里面，将英文单词所在的区域一起遮盖掉，让模型预测这个部分。
2. 很多句子里含有数字，显然在Masked LM中，让模型准确地预测数据是不现实的，所以我们把原文中的数字（包括整数和小数）都替换成一个特殊token，#NUM#，这样模型只要预测出这个地方应该是某些数学就可以了。

有梦想有行动

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
BERT预训练技巧

使用BERT预训练模型进行自然语言的情感分类之BERT训练技巧1. 因为我们是按单个字为单位训练BERT，所以在Masked LM里面，将英文单词所在的区域一起遮盖掉，让模型预测这个部分。2. 很多句子里含有数字，显然在Masked LM中，让模型准确地预测数据是不现实的，所以我们把原文中的数字（包括整数和小数）都替换成一个特殊token，#NUM#，这样模型只要预测出这个地方应该是某些数学就可以了。...
复制链接

扫一扫

有梦想有行动 CSDN认证博客专家 CSDN认证企业博客

码龄5年

201: 原创

12万+: 周排名

1万+: 总排名

29万+: 访问

: 等级

2957: 积分

428: 粉丝

232: 获赞

93: 评论

741: 收藏

私信

关注

热门文章

分类专栏

最新评论

log日志查看命令学习
有梦想有行动: truncate -s 0 logfile.log # 清空logfile日志
wireshark使用
有梦想有行动: ip.dst==192.168.69.183 and tcp contains "5=335504" and tcp contains "11=121322"
Vi/Vim的使用
有梦想有行动: Vim基本搜索命令 / 或者? 搜索在Vim普通模式下，输入 / 或 ? 符号就进入了搜索模式，/ 用于正向往下搜索，? 用于反向往上搜索。
什么是软件工程？
2301_79618957: 2021925
WireShark学习
有梦想有行动: 1：带宽表示频率宽度、1秒钟内能传输的最大数据量，单位是bps 2：100M宽带就是它说的网络带宽是100M，也就是它1秒钟最多传输100M个数据位 3：带宽指一个公路，宽带表示公路中较宽的道路

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。