![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
文章平均质量分 77
mercy1985
这个作者很懒,什么都没留下…
展开
-
相关度计算和信吵比、【最短路径】【SN搜索算法】【SN索引】【SN关系的更新】
你知道google和百度两个关键词的相关度是多少么?--最后我将来回答这个问题通常我们对于文本信息之间得相关性得计算都是采用向量的办法,我在以前的PPT里曾经提到过。然而对于文本信息更深层次的分析不能单纯从字面上分析一篇文章的关键词,更重要的是它隐含的扩展的意义。传统的关于计算文本相关度和【网页和查询的相关性】的计算都是采用匹配的方式进行的,然而这只能是基于字面意义上的统计计算。这里介绍的转载 2006-10-12 20:13:00 · 1347 阅读 · 0 评论 -
文章相关性分析
查询短语“工具的应用”两字时,任何一个搜索引擎都包含几十万甚至是上百万个多少有点关系的网页。那么哪个应该排在前面呢?显然我们应该根据网页和查询的相关性对这些网页进行排序。关键问题是如何度量网页和查询的相关性。我们知道,短语“工具的应用”可以分成三个关键词:工具、的、应用。根据我们的直觉,我们知道,包含这三个词多的网页应该比包含它们少的网页相关。当然,这个办法有一个明显的漏洞,就是长的网页比转载 2006-10-12 21:02:00 · 1416 阅读 · 0 评论