PyTorch 实现 Skip-gram

最新推荐文章于 2024-07-14 14:54:40 发布

张贤同学

最新推荐文章于 2024-07-14 14:54:40 发布

阅读量2.1k

点赞数 5

分类专栏： NLP 文章标签：自然语言处理 pytorch 深度学习

本文链接：https://blog.csdn.net/BGH12ET/article/details/109530434

版权

代码实现：https://github.com/zhangxiann/Skip-gram

这是我用于学习 Skip-gram 的笔记。

文中会有一些公式，如果 github 出现公式乱码问题，请通过我的博客查看：https://zhuanlan.zhihu.com/p/275899732。

下面废话不多说，教你手把手实现 Skip-gram。

CBOW 和 Skip-gram 是两种训练得到词向量的方法。其中 CBOW 是从上下文字词推测目标字词，而 Skip-gram 则是从目标字词推测上下文的字词。在大型数据集上，CBOW 比 Skip-gram 效果好；但是在小的数据集上，Skip-gram 比 CBOW 效果好。本文使用 PyTorch 来实现 Skip-gram 模型，主要的论文是：Distributed Representations of Words and Phrases and their Compositionality

以“the quick brown fox jumped over the lazy dog”这句话为例，我们要构造一个上下文单词与目标单词的映射关系，以quick为目标单词，假设滑动窗口大小为 1，也就是左边和右边各取 1 个单词作为上下文，这里是the和brown，可以构造映射关系：(the, quick)，(brown, quick)，这样我们就构造出两个正样本。

此外，对于这个滑动窗口外的其他单词，我们需要构造负样本，但是负样本可以是滑动窗口之外的所有单词。为了减少训练的时间，我们对负样本进行采样 k 个，称为 Negative Sampling。如 k=2，就是对每个正样本，分别构造两个负样本；例如对于(the, quick)，采样两个负样本 (lazy , quick)，(dog, quick)。Negative Sampling 的损失函数表示如下： $\underset{\theta}{\arg \max }\log \sigma\left(v_{w_{O}}^{\prime} \top_{w_{I}}\right)+\sum_{i=1}^{k} \mathbb{E}_{w_{i} \sim P_{n}(w)}\left[\log \sigma\left(-v_{w_{i}}^{\prime} T_{w_{I}}\right)\right]$ 。其中 $\sigma(x)$ 表示 sigmoid 函数， $w_{I}$ 表示目标单词， $w_{o}$ 表示正样本的上下文单词，

最低0.47元/天解锁文章

张贤同学

关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
1
评论
PyTorch 实现 Skip-gram

代码实现：https://github.com/zhangxiann/Skip-gram这篇文章来说下如何使用 PyTorch 实现 Skip-gram，文中会出现一些数学公式。CBOW 和 Skip-gram 是两种训练得到词向量的方法。其中 CBOW 是从上下文字词推测目标字词，而 Skip-gram 则是从目标字词推测上下文的字词。在大型数据集上，CBOW 比 Skip-gram 效果好；但是在小的数据集上，Skip-gram 比 CBOW 效果好。本文使用 PyTorch 来实现 Skip-.
复制链接

扫一扫