cbow和skip-gram实现关键代码解析

最新推荐文章于 2023-11-21 16:36:23 发布

王发北

最新推荐文章于 2023-11-21 16:36:23 发布

阅读量2.4k

点赞数 1

分类专栏： Deep Learning 文章标签： word embadding 词向量 cbow

本文链接：https://blog.csdn.net/wwangfabei1989/article/details/81558578

版权

Deep Learning 专栏收录该内容

41 篇文章 0 订阅

订阅专栏

源码地址： https://github.com/AlbertBJ/word2vecpy.git

这也是我 fork别人的，觉得写得很棒，所以拜读了大神的代码，先对关键点进行说明：

主要是针对 train_process这个方法中针对负采样计算方法：

# Randomize window size, where win is the max window size
# 下面4行代码，主要是获得目标词的上下文词（滑动窗口大小为win，即获取目标词的左右各 win各词）
current_win = np.random.randint(low=1, high=win+1)# 主要是利用随机的思想，每次都产生上下文词的数量为[1,win]
context_start = max(sent_pos - current_win, 0)# 这一步骤主要是针对刚开始的目标词左边（以字典索引，小于目标词索引的为左边，大于的 # 为右边）不足以产生 current_win个上下文，即当不足时，上下文索引从 0开始计算
context_end = min(sent_pos + current_win + 1, len(sent)) # 这一步和上一步目的一致，主要是针对目标词右侧不足以产生current_win个上 # 下文
context = sent[context_start:sent_pos] + sent[sent_pos+1:context_end] # Turn into an iterator? 这一步主要是产生上下文列表

# CBOW
if cbow:
# Compute neu1
neu1 = np.mean(np.array([syn0[c] for c in context]), axis=0) # 获得词嵌入向量，在此处体现 cbow和skip-gram不同点，cbow是用周边上下文词求平均后，
# 再进行与目标词的 dot(此时的目标词包括正样本以及负样本)
assert len(neu1) == dim, 'neu1 and dim do not agree'

# Init neu1e with zeros
neu1e = np.zeros(dim)

# Compute neu1e and update syn1 syn1为辅助向量
if neg > 0:
classifiers = [(token, 1)] + [(target, 0) for target in table.sample(neg)]
else:
classifiers = zip(vocab[token].path, vocab[token].code)
for target, label in classifiers:
z = np.dot(neu1, syn1[target]) # 利用平均后的上下文词词向量与每一个目标词进行 dot ，syn1存储的是每个词的模型参数
p = sigmoid(z)
g = alpha * (label - p) # 计算二分类的梯度(z的梯度是label-p,具体推导可以看我的一篇关于bp的博文)
neu1e += g * syn1[target] # 此处使用梯度上升方法，目的求得概率最大化(g*syn1[target]，更新embedding)
syn1[target] += g * neu1 # 利用梯度上升更新模型参数（g * neu1更新参数矩阵）

# Update syn0
for context_word in context: #更新每一个上下文对应的词向量矩阵
syn0[context_word] += neu1e # 利用梯度上升更新词嵌入矩阵

# Skip-gram
else:
for context_word in context: # 循环上下文词的个数
# Init neu1e with zeros
neu1e = np.zeros(dim)

# Compute neu1e and update syn1
if neg > 0:
classifiers = [(token, 1)] + [(target, 0) for target in table.sample(neg)]
else:
classifiers = zip(vocab[token].path, vocab[token].code)
for target, label in classifiers:
z = np.dot(syn0[context_word], syn1[target])
p = sigmoid(z)
g = alpha * (label - p)
neu1e += g * syn1[target] # Error to backpropagate to syn0
syn1[target] += g * syn0[context_word] # Update syn1 使用上下文更新 syn1

# Update syn0
syn0[context_word] += neu1e

知乎： https://zhuanlan.zhihu.com/albertwang

微信公众号：AI-Research-Studio

王发北

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
cbow和skip-gram实现关键代码解析

源码地址：https://github.com/AlbertBJ/word2vecpy.git这也是我 fork别人的，觉得写得很棒，所以拜读了大神的代码，先对关键点进行说明：主要是针对train_process这个方法中针对负采样计算方法： # Randomize window size, where win is the max win...
复制链接

扫一扫