数据检索
ljl_xyf
这个作者很懒,什么都没留下…
展开
-
文章相关性分析详细介绍
查询短语“工具的应用”两字时,任何一个搜索引擎都包含几十万甚至是上百万个多少有点关系的网页。那么哪个应该排在前面呢?显然我们应该根据网页和查询的相关性对这些网页进行排序。关键问题是如何度量网页和查询的相关性。我们知道,短语“工具的应用”可以分成三个关键词:工具、的、应用。根据我们的直觉,我们知道,包含这三个词多的网页应该比包含它们少的网页相关。当然,这个办法有一个明显的漏洞,就是...原创 2012-03-05 10:28:10 · 250 阅读 · 0 评论 -
Memcache,Redis,MongoDB(数据缓存系统)方案对比与分析
一、问题: 数据库表数据量极大(千万条),要求让服务器更加快速地响应用户的需求。 二、解决方案: 1.通过高速服务器Cache缓存数据库数据 2.内存数据库 (这里仅从数据缓存方面考虑,当然,后期可以采用Hadoop+HBase+Hive等分布式存储分析平台) ...原创 2015-08-26 10:04:35 · 120 阅读 · 0 评论