word2vec

Deepwalk =》 word2vec =》 node2vec

One-Hot

word embedding

将每一个单词映射为低维向量

词的个数 = 词汇表向量的维度

  • 输入是词汇表向量,当看到一个训练样本时,对于样本中的每一个词,就把相应的在词汇表中出现的位置的值置为1,否则置为0。
  • 输出也是词汇表向量,对于训练样本的标签中的每一个词,就把相应的在词汇表中出现的位置的值置为1,否则置为0。
  • 对所有的样本,训练这个神经元网络。
  • 收敛之后,将从输入层到隐含层的那些权重,作为每一个词汇表中的词的向量。

CBOW模式

适合于小型数据库

Skip-Gram模式

在大型语料中表现更好

加速

Hierarchical Softmax
Negative Sampling

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值