一、怎么得到词向量(稠密表示) 1.原理理解 输入前四个词( ~ 的特征)希望输出 的词为 C 的概率最大 one-hot在一个词典大小的空间(特别大1*40000)——> 使用矩阵来映射(40000*300维)——>向量相乘 ——> 得到1*300维的向量 一个词的one-hot编码 * 这个词典的稠密向量表示 = 这个词的稠密向量编码(定位词) 2.预期结果 使用不同语料库训练得到的语言模型不同,分类预测的结果不一样