哈夫曼编码 目的是让词频高的词有较短的编码,词频低的词的编码长度较长 CBOW 输入:c个上下文的onehot 大小为C*Vlook up table矩阵W:大小为V*N中间层:embedidng之后的词向量 大小为1N(将CN的C个词向量求平均作为词向量)矩阵W’用于将词向量转化为1*V大小,转化后的结果与这个词的实际onehot误差越小越好