![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索引擎
文章平均质量分 75
dwx2046
这个作者很懒,什么都没留下…
展开
-
搜索引擎-倒排索引基础知识
http://blog.csdn.net/hguisu/article/details/7962350搜索引擎的索引1.单词——文档矩阵 单词-文档矩阵是表达两者之间所具有的一种包含关系的概念模型,图3-1展示了其含义。图3-1的每列代表一个文档,每行代表一个单词,打对勾的位置代表包含关系。转载 2016-03-17 21:04:52 · 431 阅读 · 0 评论 -
倒排索引-搜索引擎的基石
http://blog.csdn.net/hguisu/article/details/79697571.概述 在关系数据库系统里,索引是检索数据最有效率的方式,。但对于搜索引起,他它并不能满足其特殊要求: 1)海量数据:搜索引擎面对的是海量数据,像Google,百度这样大型的商业搜索引擎索引都是亿级甚至几千的网页数量 ,面对如此海量数据 ,转载 2016-03-17 21:06:43 · 536 阅读 · 0 评论 -
搜索引擎原理 – 正排索引、倒排索引以及齐普夫法则
http://www.tinysz.com/36.html我们在提交一个关键字时,搜索引擎是如何快速定位到包含有此关键字的相关页面的?这就是索引系统的功劳,索引系统负责为关键字和网页建立对应关系,使得在海量网页中迅速查找成为可能。索引首先我们先介绍下索引(Index)。索引本质上是一种记录信息的信息,它本身占较小的体积,但记录了关键字在整个系统中出现的位置。日常生活转载 2016-03-17 21:11:37 · 3556 阅读 · 0 评论 -
搜索引擎核心技术笔记
搜索引擎发展史1 分类目录:hao123 人工整理2 文本检索:使用布尔模型、向量空间模型或者概率模型计算查询词和网页文本内容的相关程度未考虑网页之间的链接关系3 链接分析:google pagerank技术 未考虑用户的个性化需求4 用户中心的一代:利用用户查询的时间、地点,过去发出的查询及点击记录来理解用户真正的需求3个目标:更全 更快 更准3个核心原创 2016-11-02 22:20:08 · 2950 阅读 · 0 评论