词嵌入与词向量:
词向量还挺好理解的,就是将一个词用一组数字完成的向量来表示,至于咋表示,那方法就很多了,就比如独热、tfidf之类的。那他又为啥会跟词嵌入扯上关系呢?害,先来解释啥叫嵌入。经过一番的搜索,理解成嵌入通常是指将一个高维的向量映射到低维向量中去。因为这么着能够减少计算过程中的空间消耗,提高效率,所以呀,人们就经常这么干。那么这个词嵌入是啥呢,就是说你从高维词向量转换为低维词向量的这个过程,就叫做词嵌入。至于咋转换的,以后再说吧。(我琢磨着,嵌入这个词放到别的地方应该也可以这么理解。比如啥知识图嵌入啥的)
分布表示与分布式表示:
先来看分布表示,分布是啥意思,就是说一个词用一个东西可能解释不清楚,那咱们就把他分成几部分来解释,大概就是这个意思。比如还是说一个词,用独热来表示的话,他就一行,但是用矩阵来表示的话,那他就好几行好几列呢,那当然是用矩阵表示的更清楚了,数值大概就是概率的形式进行表示的。但是可能他每个位置是这个词与谁的关系就可能不太清楚,但是也不用太清楚吧。再来说分布式表示,这个分布式表示又与嵌入这个词相关了,是指“把文本分散嵌入到另一个空间,一般从是从高维空间嵌入到低维空间”
(想到再说吧)