![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
学不下了
这个作者很懒,什么都没留下…
展开
-
相似度算法--余弦相似度
转载:http://blog.csdn.net/u012160689/article/details/15341303 余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。 上图两个向量a,b的夹角很小可以说a向量和b向量有很高的的相似性,极端情况下...转载 2018-08-01 00:28:28 · 27260 阅读 · 5 评论 -
NPL-TFIFD
TFIDF一 简介1、TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。2、TFTF意思是词频(Term Frequenc),某个词在文章出现的次数。停用词:词频也不是绝对的,像出现次数最多的词是----"的"、"是"、"在"----这一类最常用的词。它们叫做"停用词"(stop wor...原创 2018-08-07 19:59:39 · 296 阅读 · 0 评论