搜索引擎发展史

转载 2006年05月17日 20:38:00
  在互联网发展初期,网站相对较少,信息查找比较容易。然而伴随互联网爆炸性的发展,普通网络用户想找到所需的资料简直如同大海捞针,这时为满足大众信息检索需求的专业搜索网站便应运而生了。

  现代意义上的搜索引擎的祖先,是1990年由蒙特利尔大学学生Alan Emtage发明的Archie。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,而且由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage想到了开发一个可以以文件名查找文件的系统,于是便有了Archie。

  Archie工作原理与现在的搜索引擎已经很接近,它依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。由于Archie深受用户欢迎,受其启发,美国内华达System Computing Services大学于1993年开发了另一个与之非常相似的搜索工具,不过此时的搜索工具除了索引文件外,已能检索网页。

  当时,“机器人”一词在编程者中十分流行。电脑“机器人”(Computer Robot)是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序。由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序。

  世界上第一个用于监测互联网发展规模的“机器人”程序是Matthew Gray开发的World wide Web Wanderer。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。

  与Wanderer相对应,Martin Koster于1993年10月创建了ALIWEB,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo。

  随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Matthew Gray的Wanderer基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以JumpStation、The World Wide Web Worm(Goto的前身,也就是今天Overture),和Repository-Based Software Engineering (RBSE) spider最负盛名。

  然而JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。

  最早现代意义上的搜索引擎出现于1994年7月。当时Michael Mauldin将John Leavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年4月,斯坦福(Stanford)大学的两名博士生,David Filo和美籍华人杨致远(Gerry Yang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语。比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨!

  随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。象国外的Inktomi(已被Yahoo收购),它本身并不是直接面向用户的搜索引擎,但向包括Overture(原GoTo,已被Yahoo收购)、LookSmart、MSN、HotBot等在内的其他搜索引擎提供全文网页搜索服务。国内的百度也属于这一类(注1)搜狐新浪用的就是它的技术(注2)。因此从这个意义上说,它们是搜索引擎的搜索引擎。

  (注1):百度已于2001年9月开始提供公共搜索服务。
  (注1):搜狐二级网页搜索现已改为中搜的引擎,而新浪则已转用Google的搜索结果。

1.4 Java发展简史

1.4 Java发展简史 1.4   Java发展简史 本节将介绍Java的发展简史。这些参考资料来源于多方面的出版物(最重要的是SunWo...
  • helongfu
  • helongfu
  • 2015年07月11日 17:26
  • 662

计算机发展历史(详细)

计算机发展历史(详细)   本文来自CSDN论坛,仅供参考 计算机(computer)俗称电脑,是一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按...
  • zzwu
  • zzwu
  • 2017年09月02日 09:36
  • 2792

无人机系列之发展史

一.引言 何谓无人机?其实就是无人驾驶飞机的简称,应为缩写为“UAV”。是一种无线遥控的无人驾驶飞机。2016年无人机作为消费电子类的重点戏迅速点燃了整个消费市场,一时间家喻户晓,在引起消费者狂热追捧...
  • ad3600
  • ad3600
  • 2017年02月09日 14:40
  • 2484

如何做到让各大搜索引擎收录你的网站!

如何做到让各大搜索引擎收录你的网站!   目前在国内主流的搜索引擎无外乎以下几个:  1、百度  2、Google  3、Yahoo(Yisou、3721)  有的人还会补充上“SoG...
  • qq_19244423
  • qq_19244423
  • 2015年11月17日 10:13
  • 1625

十年WEB技术发展历程

ajax 03年的时候我上六年级,那时候网吧刚在小县城的角落萌生。传奇,大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩,然后接下来的一个小时我一直在,注,册,账,...
  • testin_slow999
  • testin_slow999
  • 2015年07月10日 15:47
  • 646

计算机系统-计算机硬件及系统发展史

纵观计算机发展史,可知晓,是需求带动了发展,从古至今,一点点剖析。
  • wangpeifeng669
  • wangpeifeng669
  • 2014年07月29日 09:12
  • 926

搜索引擎的设计与实现(一)从零开始?

毕业狗一枚,即将步入职场。仅以此系列,记录毕业设计中遇到的问题和解决的具体思路,重点不是完整的代码,而是得到完整代码的思考过程。所以只会贴出部分代码,勿怪。专业是电子商务,除了万恶的经管大类课程,技术...
  • u010386006
  • u010386006
  • 2015年06月19日 16:26
  • 1410

Unix和Linux的的发展史

首先说明本帖是转的,旨在让大家了解科技界的一些故事,每一种科技的进步都伴随开发者们不懈的努力! Unix是目前还在存活的操作系统的元老了,走过了40年的历程。由它引发的思想变革,对当今计算机文化...
  • Acmen99
  • Acmen99
  • 2016年04月14日 19:53
  • 2044

自己动手写搜索引擎

实现了一个搜索引擎,可以检索csdn网站的所有博客文章,当然,最新的文章是没有的。    先说下项目思路吧, 整个项目分为6个子程序:        爬虫1:爬取所有csdn网站的网页,并将爬到的博客...
  • kyt511
  • kyt511
  • 2015年08月14日 14:49
  • 1677

B/S结构模式的发展史(有助了解)

一个成熟的大型网站(如淘宝、京东等)的系统架构并不是开始设计就具备完整的高性能、高可用、安全等特性,它总是随着用户量的增加,业务功能的扩展逐渐演变完善的,在这个过程中,开发模式、技术架构、设计思想也发...
  • AinUser
  • AinUser
  • 2017年04月13日 10:30
  • 205
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:搜索引擎发展史
举报原因:
原因补充:

(最多只允许输入30个字)