![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
杂乱学习
yeting2010
这个作者很懒,什么都没留下…
展开
-
搜索引擎技术总结2-google原理总结
google原理:crawler从urlserver获得域名列表,将搜索到的网页送入storeserver,压缩网页存入repository,并从网页中解析出一个新的url时则分配给此网页一docID.indexer读取repository,解压并解析文档,每一文档转换成一组具体值为hits的一组词。hits记录了该单词及在文档中的位置,字体大小等。indexer把这些hits分配到一组barre转载 2008-10-25 22:13:00 · 652 阅读 · 0 评论 -
搜索引擎技术总结1
搜索引擎一般由搜索器,索引器,检索器和用户接口组成。搜索器:日夜运行的程序搜集网络上各类新信息,更新旧信息--1.从一起始url以宽度优先或深度优先或启发式方式循环在网络中发现信息。2.将web空间按照域名,IP地址和国家名划分,每个搜索器负责一个子空间的穷经搜索。索引器:理解搜索器搜索到的信息,抽取出索引项建立索引表。索引项有客观索引和内容索引。客观索引与文档语意无关如作者名时间等;内容转载 2008-10-25 21:26:00 · 949 阅读 · 0 评论