bert模型的输出

最新推荐文章于 2024-06-05 15:21:38 发布

junjian Li

最新推荐文章于 2024-06-05 15:21:38 发布

阅读量9.9k

点赞数 9

分类专栏： NLP 文章标签： bert pytorch 深度学习

本文链接：https://blog.csdn.net/qq_30129009/article/details/122232174

版权

8 篇文章 1 订阅

订阅专栏

bert模型的输出可以包括四个：

last_hidden_state：torch.FloatTensor类型的，最后一个隐藏层的序列的输出。大小是(batch_size, sequence_length, hidden_size) sequence_length是我们截取的句子的长度，hidden_size是768.
pooler_output： torch.FloatTensor类型的，[CLS]的这个token的输出，输出的大小是(batch_size, hidden_size)
hidden_states ：tuple(torch.FloatTensor)这是输出的一个可选项，如果输出，需要指定config.output_hidden_states=True,它也是一个元组，它的第一个元素是embedding，其余元素是各层的输出，每个元素的形状是(batch_size, sequence_length, hidden_size)
attentions：这也是输出的一个可选项，如果输出，需要指定config.output_attentions=True,它也是一个元组，它的元素是每一层的注意力权重，用于计算self-attention heads的加权平均值

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注