Negative Sampling(NEG)利用随机负采样,能大幅度提高性能。
符号定义
对于样本,词
为正样本,其他词为负样本。假定已经选好了一个关于
的负样本子集
,且对
,定义
表示词的标签, 即正样本的标签为1, 负样本的标签为0.
我们希望最大化
其中
所以
其中表示
中各词的词向量之和,而
表示词
对应的一个辅助向量,为待训练参数。
目标函数
梯度计算及参数更新
设,则
于是的更新公式可写为
中由
和
的对称性有
的更新公式为
基于Negative Sampling的CBOW的伪代码