![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数学与算法
nuclear_sun
这个作者很懒,什么都没留下…
展开
-
TF-IDF与余弦相似性的应用(一):自动提取关键词
转自:http://www.ruanyifeng.com/blog/2013/03/tf-idf.html 作者: 阮一峰 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到? 这个问题涉及到数据挖掘转载 2015-01-21 09:44:19 · 376 阅读 · 0 评论 -
TF-IDF与余弦相似性的应用(二):找出相似文章
转自:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html 作者: 阮一峰 上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了转载 2015-01-21 09:47:14 · 391 阅读 · 0 评论