论文:http://demo.clab.cs.cmu.edu/cdyer/nce_notes.pdf
参考:(三)通俗易懂理解——Skip-gram的负采样 - 知乎
主要参考:pytorch 源代码 NCELoss
目录
🍇 nce_loss
其实就是二元交叉熵BCE,只不过负样本比正样本有个权重,是K,然后这个权重在损失函数上还要做归一化,也就是1/K+1 和 K/K+1。是对比学习类似Pairwise的思想, 再加上代价敏
论文:http://demo.clab.cs.cmu.edu/cdyer/nce_notes.pdf
参考:(三)通俗易懂理解——Skip-gram的负采样 - 知乎
主要参考:pytorch 源代码 NCELoss
目录
其实就是二元交叉熵BCE,只不过负样本比正样本有个权重,是K,然后这个权重在损失函数上还要做归一化,也就是1/K+1 和 K/K+1。是对比学习类似Pairwise的思想, 再加上代价敏