Word Mover Distance(WMD,词移距离)模型
文本表示方式词袋模型(BOW,bag od words)词袋模型假设我们不考虑文本中词与词之间的上下文关系,仅仅只考虑所有词的权重。而权重与词在文本中出现的频率有关。举个例子,来说明词袋模型。假设语料库中只有两个句子。Jane wants to go to Shenzhen.Bob wants to go to Shanghai.分词后,将所有词语装进一个袋子里,不考虑词法和语序的问题,即每个词语都是独立的。上面两个句子,就可以构成一个词袋。[Bob,go, Jane, Shanghai
原创
2020-07-17 23:34:20 ·
1172 阅读 ·
0 评论