1、TF-IDF与余弦相似性的应用(一):自动提取关键词 2、TF-IDF与余弦相似性的应用(二):找出相似文章 3、如何计算两个文档的相似度(一) 4、 gensim做主题模型 5、 当然还可以看看吴军博士的《数学之美》第十一章 如何确定网页和查询的相关性。 其中第4篇文章( gensim做主题模型 )使用了python的gensim工具包做了关于使用TF-IDF、LDA和LSI的文档相似度比较。