如何测量相似度? 如何在文章中搜索? 用于测量相似度的单词计数表示 测量相似度 单次计数的问题-文档长度-解决:归一化向量 文档复制两倍->相似度增加4倍 解决方法:归一(将不同长度文章置于平等的地位) 应用TF-IDF对于重要单词进行优先级排序 Key Word TF-IDF文档表示方式