信息检索
gcyxf
这个作者很懒,什么都没留下…
展开
-
Jaccard系数(Jaccard Coefficient)和tf-idf方法
这个方法在信息检索或者搜索引擎中经常用到,用于衡量两个词库的交集。这里面的两个词库可能来源于文档或者请求的语句。虽然简单,但是很实用。比如A和B是由文档(Document)或者请求语句(Query)得到的两个词库 (term sets)。所以,我们有 JACCARD(A, A) = 1; 当A∩B=0时, JACCARD(A, B) = 0; 0=注意,两个词库A和B大翻译 2014-09-22 19:16:16 · 11152 阅读 · 1 评论 -
Vector Space Model (向量空间模型)
向量空间模型(vector space model)在信息检索翻译 2014-09-22 20:22:12 · 7297 阅读 · 0 评论