![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习算法
zhangqiang1104
这个作者很懒,什么都没留下…
展开
-
TF-IDF算法
参考:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.htmlTF-IDF是一种统计方法,用以评估一字词对于一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF应用:自动提取关键词http://www.ruanyifen原创 2015-12-12 16:20:55 · 694 阅读 · 0 评论 -
主题模型LDA
传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的。 举个例子,有两个句子分别如下: “乔布斯离我们而去了。” “苹果价格会不会降?” 可以看到上面这两个句子没有共同出现的单词,但这两个句子是相似的,如果按传统的方法判断这两个句子肯原创 2015-12-12 16:21:20 · 402 阅读 · 0 评论