阅读习惯的改进
文选
【参考译文 】
超 载 的 网络
新的研究称,网络信息堆积如山,搜索引擎跟不上步伐。
华盛顿 现在,使用计算机在浩如烟海的网络资料中寻找某条信息,
要分拣大约 亿 千万的网页,即使是最好的搜索工具最多也只能检索网页
总量的
即将在 《科学》期刊上发表一项研究的作者之一、 研究院的史蒂
夫 劳伦斯说,互联 网上 的情况不可能会变得更容易,在 以后 的几年里,
网页的数量将增加 “不 断增 加成千上万 的网页 ,”劳伦斯说 ,“没有
简单 的方法将所有 网页编入检索,网上从未有人访 问过 的网页所 占的比例
可 以是任何一个数字。”
劳伦斯和 同样来 自 的 李
贾尔斯作过分析 ,科学家如何才能更好
地使用检索服务在 网上找到某个具体 的
信息,如 电子 图书馆那样通过主题和词
组分拣和检索亿万页数据 。这些服务就
是通常所说 的“搜索 引擎 ”。
劳伦斯说,他们发现网上 的信息量
如此 巨大,使得人们对其加 以整理的最
大努力也相形见绌,电子虚拟世界中可
能存在着大量的从未被人看到的网页……
研究人员分析了 个最大的搜索引擎对 个科学问题检索的响应……
劳伦斯说,根据这项研究,他估计 网上大约有 亿 千万个页面浏览者
是可 以偶然接触到的……
拉特格斯大学计算机学教授海曼 赫什说,弄清 问题 的真实情况有助
于人们找到控制信息爆炸的方法。 “每个人都知道网络巨大无 比,查询东西
非常困难,”他说, “网络是一种未经整理、杂乱无章的信息源的堆积,使
人完全无能为力 。”
研 究人员说 ,一个 叫做 的搜索引擎有最全面 的网络检索 ,但也
仅仅覆盖 了可检索 的网页 的 。在这些搜索 引擎名单 中排在最后 的是
,能覆盖
这项研究说,在其他三个搜索引擎 中, 覆盖 了
大约覆盖 大约覆盖 的首席技术官格雷厄姆
斯潘塞说 ,搜索引擎试 图检索所有 的网站也不实 际,因为人们 已经抱怨被
信息淹没了。
仅仅一个查询就会产生一个涉及千百万个 网页的结果,使人们在被信
息淹没的同时又渴求信息。
斯潘塞说, 和其他搜索引擎与其试 图收录整个 网络 ,不如只选择
他们认为最好 的信息。 “我们努力把主要工作放在实用性方面 ,即用户实际
用到的信息。”他说。
劳伦斯指 出,人们在 网上搜索时,通过使用两个或更多的搜索引擎可
以增加成功的机会 。如果 同时使用五个搜索引擎来查询一个 问题 …… 比仅
仅使用一个搜索引擎大约多扫描三倍的网页。
劳伦斯说,网上 的信息爆炸也许可 以通过诸如