python-pytorch实现skip-gram 0.5.001

liwulin0506

已于 2024-04-09 17:26:47 修改

阅读量315

点赞数 5

分类专栏： python pytorch 文章标签： python pytorch 开发语言

于 2024-04-09 17:14:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60688978/article/details/137558929

版权

该博客详细介绍了如何使用Python和PyTorch实现skip-gram模型，包括数据加载与切词、模型和参数准备、训练过程、模型保存与加载、词向量获取、词向量分布图的绘制以及计算词向量相似度的方法，参考了多个CSDN上的相关文章。

摘要由CSDN通过智能技术生成

python-pytorch实现skip-gram 0.5.000

数据加载、切词

按照链接https://blog.csdn.net/m0_60688978/article/details/137538274操作后，可以获得的数据如下

wordList 文本中所有的分词，放入这个数组中
raw_text 这个可以忽略，相当于wordlist的备份，防止数据污染了
vocab 将wordList转变为set,即set(wordList)
vocab_size 所有分词的个数
word_to_idx 字典格式，汉字对应索引
idx_to_word 字典格式，索引对应汉字

准备训练数据

data3 = []
window_size1=2
for i,word in enumerate(raw_text):
    target = raw_text[i]
    contexts=raw_text[max(i - window_size1, 0): min(i + window_size1 + 1, len(raw_text))]
    for context in contexts:
        if target!=context:
            data3.append((context,target))
data3,len(data3)

准备模型和参数

# 超参数
learning_rate = 0.003
device = torch.device('cpu')
embedding_dim = 100
epoch = 10
class SkipGramModel(nn.Module):
    def __init__(self, vocab_size, embedding_dim):
        super(SkipGramModel, self).__init__()
        self.embedding = nn.Embedding(vocab_size, embedding_dim)
        self.linear = nn.Linear(embedding_dim, vocab_size)
        
    def forward(self, center_word)

最低0.47元/天解锁文章

关注

5
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python-pytorch实现skip-gram 0.5.001

python-pytorch实现skip-gram 0.5.000
复制链接

扫一扫

专栏目录

liwulin0506 CSDN认证博客专家 CSDN认证企业博客

码龄3年

339: 原创

2万+: 周排名

8844: 总排名

20万+: 访问

: 等级

4002: 积分

856: 粉丝

527: 获赞

17: 评论

553: 收藏

私信

关注

热门文章

分类专栏

python 57篇
pytorch 42篇
jupyter notebook 1篇
tranformers 6篇
java 96篇
javafx 40篇
unity 12篇
unity2d 9篇
常用工具
aseprite 1篇
excel 2篇
poi 2篇
二开笔记 4篇
php 5篇
npm 1篇
piplines 1篇
health 1篇
常见报错 1篇
杂项 1篇
git 1篇
java辅助 4篇
python报错 2篇
idea 1篇
java设计模式 1篇
JAVA-DJL 2篇

最新评论

python-pytorch使用日志0.5.061
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、兼容 loguru模式。相比 loguru 有10胜。 pip install nb_log 。
python-pytorch 下批量seq2seq+Bahdanau Attention实现问答1.0.000
ha_lydms: 给作者大大点赞！这是一篇优质好文，对我学习又有了信道帮助哦，复习好物，三连值得，内容详细易懂
java-jna-hook代码
qq_41201439: 大佬，要导入哪些依赖包
python-pytorch 利用word2vec实现lstm模型预测中文文本输出0.1.00
ha_lydms: 这篇博客的内容总是能够触动我的内心深处，让我对于人生有了更深层次的思考和体验。
python-pytorch关于next和iter使用时没有效果的笔记
ha_lydms: 我很喜欢作者的文笔，每次阅读都能够让我沉浸其中，忘记时间流逝。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。