pytorch小白记录

最新推荐文章于 2024-07-16 15:58:20 发布

霸王国际

最新推荐文章于 2024-07-16 15:58:20 发布

阅读量318

点赞数

分类专栏：深度学习文章标签： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36749157/article/details/100930875

版权

这篇博客记录了PyTorch小白的学习过程，涉及如何载入预训练的词向量，理解torch数据类型，以及网络结构设计。载入词向量时，通过word_to_idx和idx_to_word创建词向量矩阵。在PyTorch中寻找类似于TensorFlow的embedding_lookup函数。同时强调了在处理数据和模型时，注意数据类型和设备（CPU/GPU）的一致性。

摘要由CSDN通过智能技术生成

持续更新

1、载入已经训练好的词向量

逻辑

已经训练好的词向量：word2vec glove等等
1、从中生成一个word2id的字典，将每个单词/字映射到下标，得到字典word_to_idx， idx_to_word
2、假设data中有n个单词/字，词向量维度为m，得到该数据集的词向量矩阵n*m
3、词向量矩阵n*m word_to_idx， idx_to_word 根据这三个得到model的input，假设数据中有N个句子，得到的input N*max_sequence_len*m
自己训练的词向量，保存的时候，矩阵下标和word_to_idx一一对应，直接进行第三步
tensorflow中有加快查找的函数embedding_lookup，torch中暂时没找到类似函数。后续再看看有没有更快的实现方式。

2、torch数据类型

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。