GPT/BERT训练：Creating MTGP constants failed

最新推荐文章于 2024-04-24 09:06:58 发布

iSikai

最新推荐文章于 2024-04-24 09:06:58 发布

阅读量866

点赞数

分类专栏： NLP pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oksupersonic/article/details/105253647

版权

NLP 同时被 2 个专栏收录

17 篇文章

订阅专栏

2 篇文章

订阅专栏

这个bug有两种原因。
一是在pytorch早期版本中，使用了超过512的序列长度，见：训练bert中的一些坑。
二是config文件和model不相符，有可能是你添加了special token，但是没有添加到model的embedding_size里。
在huggingface系预训练model中，使用这一的句子添加special token是安全的。

def add_special_tokens_(model, tokenizer):
    """ Add special tokens to the tokenizer and the model if they have not already been added. """
    orig_num_tokens = len(tokenizer.encoder)
    num_added_tokens = tokenizer.add_special_tokens(ATTR_TO_SPECIAL_TOKEN) # doesn't add if they are already there
    if num_added_tokens > 0:
         model.resize_token_embeddings(new_num_tokens=orig_num_tokens + num_added_tokens)

博客等级

码龄8年

68
原创

58
点赞

157
收藏

12
粉丝

关注

私信

分类专栏

NLP 17篇
python开发 9篇
pytorch 2篇
Linux 3篇
tensorflow 2篇
FPGA 1篇
VHDL 1篇
AllenNLP 2篇
概率dp 5篇
矩阵快速幂 1篇
碎碎念
机组 3篇
GAN 1篇

展开全部收起

最新评论

补码的加减法
做而论道_CS: “带符号数” 运算的结果，必然还是 “带符号数”。那么，它代表的十进制数，是什么呢？由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8421；如果是八位的补码，各个位的权则是：　－128、64、32、16、8421。　例如，补码是：1110 0000，它代表的十进制是：－128 + 64 + 32 = －32。如果，补码是：0110 0000，它代表的十进制是：0 + 64 + 32 = ＋96。在这里仅仅使用【进制转换】，就完事了！根本就不用取反加一转换到反码原码！
补码的加减法
做而论道_CS: 八位二进制的范围是：0 ~ 255。其中的 0 ~ 127 就是正数。另外的 128 ~ 255 是负数的补码。 0 ~ 127 的二进制，最高位是 0；而 128 ~ 255 的最高位是 1。这个最高位，是正负数的特征位。这个位的值，是自然形成的，并非是人为规定的 “符号位”。用二进制计算时，如果：　两个正数相加，和却大于 127，这就是溢出了。　负数（补码）相加，和小于 128，也是溢出了。溢出判断，就这么简单。
补码的加减法
做而论道_CS: 补码，并没有你写的这么复杂。不过就是一个【代替负数】的正数而已。把负数变成补码（正数）之后，计算机中就没有负数了。同时，减法，也就转换成了加法运算。那么，计算机只需配置一个加法器，便可横行天下。计算机中的运算，就是针对正数，进行加法运算。
Pycharm远程调试服务器
我最拐: 用的什么服务器啊
GPT-2代码解读[1]：Overview和Embedding
有梦想的鱼: 代码链接呢

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。