Bert pytorch 版本解读之 Bert pretraining 中mask的实现

最新推荐文章于 2025-03-21 14:23:43 发布

JL_Jessie

最新推荐文章于 2025-03-21 14:23:43 发布

阅读量7.8k

点赞数 8

分类专栏： NLP 文章标签： BERT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37531129/article/details/103059207

版权

BERT Mask 方法

从Bert 论文中,我们可以知道BERT在pretrain的时候会对训练集进行MASK 操作, 其中mask的方法是:

15%的原始数据被mask, 85% 没有被mask.
对于被mask的15% 分3种处理方式: 1) 其中80%是赋值为MASK. 2) 10%进行random 赋值,3)剩下10%保留原来值.

伯努利函数

在 hunggingface transformer 中, Bert 的mask的方法实现主要是靠torch.bernoulli()函数来完成.
首先, 介绍一下torch.bernoulli() 函数:

torch.bernoulli 函数是从伯努利分布中根据input的概率抽取二元随机数(0或者1)，输出与input相同大小的张量, 输出的张量的值只有0和1.
```
torch.bernoulli(input, out=None):
    input(Tensor) - 输入为伯努利分布的概率值
    out(Tensor, optional)
```
- input 输入中所有值必须在[0, 1]区间(即概率值)，输出张量的第i个元素值，将以输入张量的第i个概率值等于1.
- 返回值将会是与输入相同大小的张量，每个值为0或1

Mask 代码注释

在run_lm_finetuning.py中, 有函数 mask_tokens()

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。