无法get_word_embedding(text)

最新推荐文章于 2024-09-14 18:24:21 发布

lu3710808

最新推荐文章于 2024-09-14 18:24:21 发布

阅读量70

点赞数 1

文章标签： word embedding

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lu3710808/article/details/138588002

版权

def get_word_embedding(word):
    input_ids = tokenizer.encode(word, return_tensors='pt', padding=True, truncation=True, max_length=128)
    with torch.no_grad():
        output = Bertmodel(input_ids)
        last_hidden_states = output.last_hidden_state  # 获取最后一层隐藏状态（向量表示）
        attention_mask = output.attentions  # 获取每层的注意力分布
    # 使用注意力分布计算加权平均向量表示
    word_embedding = torch.matmul(attention_mask, last_hidden_states).mean(dim=1).squeeze().numpy()
    return word_embedding

X_embeddings = [get_word_embedding(text) for text in X]

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

lu3710808 CSDN认证博客专家 CSDN认证企业博客

码龄3年

1: 原创

187万+: 周排名

191万+: 总排名

68: 访问

: 等级

13: 积分

0: 粉丝

1: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

无法get_word_embedding(text) 70

最新评论

无法get_word_embedding(text)
lu3710808: 哦好像解决了

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。