pytorch小白 记录

这篇博客记录了PyTorch小白的学习过程,涉及如何载入预训练的词向量,理解torch数据类型,以及网络结构设计。载入词向量时,通过word_to_idx和idx_to_word创建词向量矩阵。在PyTorch中寻找类似于TensorFlow的embedding_lookup函数。同时强调了在处理数据和模型时,注意数据类型和设备(CPU/GPU)的一致性。
摘要由CSDN通过智能技术生成

持续更新

1、载入已经训练好的词向量

逻辑

  • 已经训练好的词向量:word2vec glove等等
    1、从中生成一个word2id的字典,将每个单词/字映射到下标,得到字典word_to_idx, idx_to_word
    2、假设data中有n个单词/字,词向量维度为m,得到该数据集的词向量矩阵n*m
    3、词向量矩阵n*m word_to_idx, idx_to_word 根据这三个得到model的input,假设数据中有N个句子,得到的input N*max_sequence_len*m
  • 自己训练的词向量,保存的时候,矩阵下标和word_to_idx一一对应,直接进行第三步
  • tensorflow中有加快查找的函数embedding_lookup,torch中暂时没找到类似函数。后续再看看有没有更快的实现方式。

2、torch数据类型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值