Word Mover Distance(WMD,词移距离)模型
文本表示方式
词袋模型(BOW,bag od words)
词袋模型假设我们不考虑文本中词与词之间的上下文关系,仅仅只考虑所有词的权重。而权重与词在文本中出现的频率有关。
举个例子,来说明词袋模型。假设语料库中只有两个句子。
Jane wants to go to Shenzhen.
Bob wants to go to Shanghai.
分词后,将所有词语装进一个袋子里,不考虑词法和语序的问题,即每个词语都是独立的。上面两个句子,就可以构成一个词袋。
[Bob,go, Jane, Shanghai
原创
2020-07-17 23:34:20 ·
1077 阅读 ·
0 评论