基于hierarchical softmax的CBOW模型

一、两种词向量:

  1. one-hot representation

在这里插入图片描述

  1. distributed representation

在这里插入图片描述

二、hierarchical softmax模型
(一)CBOW模型
概括:

  1. 输入层:传入词w的前后c个词语的词向量,一共2c个词向量。
  2. 投影层:将输入层的2c个向量求和累加,得到向量Xw。
  3. 输出层:输出层对应一棵Huffman树。对于词典D中任意一个词语w,从根节点出发到最后的词语w的路径为Pw, 存在lw-1个分支。每一次分支就是一个二分类,分别记为正、负分类(正负对应左右子树)。每一次二分类就产生一个概率。将这些概率相乘,通过投影层的Xw向量,得到词语w的条件概率
  4. 用条件概率构造对数似然函数。
  5. 使用随机梯度上升法,计算似然函数的最优值。
  • 随机梯度法:每去一次样本就对参数刷新一次。用似然函数对参数分别求导,求出更新的系数。然后对每一个参数进行更新。
  • 关键在于构造条件函数。
  • 参数skip_window:代表从input word的一侧选取词的数量。
  • 参数num_skips:代表选取多少个不同的词作为我们的output word。
  • 当skip_window = 2,num_skips = 2时,将会得到两组(input word,output word)形式的训练数据。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

参考文献:https://www.cnblogs.com/peghoty/p/3857839.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值