1.层次softmax 2.负采样 为什么要负采样 加快计算速度,如果不用就需要全量更新隐藏的矩阵,维度太大(比如10w个单词,每个单词映射为300维,那么就是10w*300维矩阵,每次都要更新一遍) 负采样是什么 3.根据频率抽样