Transformers hidden states相关总结

susisheng

已于 2023-11-15 11:23:52 修改

阅读量488

点赞数

文章标签：人工智能深度学习 transformer python nlp

于 2023-11-14 15:20:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/susisheng/article/details/134399269

版权

model inputs_id
inputs_id 为tensor，大小为batch_size*seq_len
hidden states 获取

input_ids = torch.tensor([tokenizer.encode(test_text, add_special_tokens=True)])
emb = model(input_ids, output_hidden_states=True)
hidden_states = emb.hidden_states

这里hidden_state为一个list，长度为model的layer数+1，第一层是embedding之后得到的结果

embedding_output = model.embeddings(
   input_ids=input_ids
)
encoder_outputs = model.encoder(
    embedding_output,
    output_hidden_states=True
)
embedding_output == encoder_outputs.hidden_states[0]
>>> True

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Transformers hidden states相关总结

这里hidden_state为一个list，长度为model的layer数+1，第一层是embedding之后得到的结果。
复制链接

扫一扫

susisheng CSDN认证博客专家 CSDN认证企业博客

码龄1年

10: 原创

143万+: 周排名

25万+: 总排名

9632: 访问

: 等级

110: 积分

0: 粉丝

10: 获赞

5: 评论

9: 收藏

私信

关注

热门文章

最新评论

Transformers hidden states相关总结
CSDN-Ada助手: 恭喜您撰写了第10篇博客！您对Transformers hidden states的总结让我受益匪浅。我希望您能继续分享您的见解，或许可以考虑探讨一些实际应用案例，或是深入研究一些相关的新技术。期待您的下一篇作品！
模型训练合集（持续更新）
CSDN-Ada助手: 恭喜您撰写了第9篇博客，标题为“模型训练合集”！您的持续创作让读者们受益匪浅。在这个合集中，您分享了许多关于模型训练的知识和经验，让我们受益良多。接下来，我想提供一些建议，希望对您的下一步创作有所帮助。考虑到您在模型训练方面的专业知识，我建议您可以进一步探讨一些实际案例，以便读者更好地理解如何应用这些技术。此外，您也可以分享一些与模型训练相关的挑战和解决方案，这将使您的博客更加丰富和实用。希望我的建议对您有所启发。再次恭喜您的成果，期待您未来更多精彩的创作！
解决jupyter notebook中args = parser.parse_args()报错的问题
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“解决jupyter notebook中args = parser.parse_args()报错的问题”非常吸引人。感谢您分享如何解决这个问题，对于许多Jupyter Notebook用户来说，这是非常有用的信息。我希望您能继续保持创作的热情和努力。在下一步的创作中，我建议您可以考虑分享更多关于Jupyter Notebook的技巧和经验。您可以进一步探索其他常见问题的解决方法，或者分享一些高级功能的使用技巧。这样的博客对于那些对Jupyter Notebook有兴趣的读者来说将会非常有价值。期待您的下一篇博客！
Python：使用Pool实现并行化计算
CSDN-Ada助手: 非常棒的博客！恭喜您写了第6篇博客，并且标题看起来非常吸引人。使用Pool实现并行化计算是一个非常有趣和实用的主题。您的文章让我对Python中的并行计算有了更深入的了解。希望您能继续保持创作的势头！我个人认为下一步您可以考虑分享一些实际案例，展示在实际项目中如何应用并行化计算来提高效率和性能。这样的话，读者们可以更好地理解并应用您所分享的知识。期待您的下一篇博客！
fire库使用
CSDN-Ada助手: 恭喜您撰写第7篇博客！您对于"fire库使用"的文章内容非常有见地，解释得十分清晰易懂。感谢您分享与我们。在我看来，下一步您可以考虑探索一些与fire库相关的高级用法或者结合实际案例进行更深入的探讨。期待您的下一篇博客，继续为我们带来更多有价值的内容。加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。