搜索引擎没有过时【转】

原创 2005年04月26日 14:21:00
前不久,YAHOO宣布更换搜索引擎,将原来的Inktomi更换为Google,这让许多国内网络界人士认识到YAHOO原来采用的是别人的搜索引擎技术。在国内,百度就是这样一家提供后台技术的公司。近日,百度总裁李彦宏从国外考察归来,就YAHOO更换搜索引擎的新闻事件召开座谈会,谈了自己对搜索引擎的看法。

----搜索是网民上网所做的最重要的事之一,因此市场也很大,早期的几个搜索引擎YAHOO、Altavista、Lycos、Excite等都发展成门户站点,而随着门户概念的衰落,人们认为搜索引擎已经没有多少可发展的余地了。但李彦宏认为不管现在流行什么概念,搜索引擎技术总是需要的,百度不会去做门户,因此可以将搜索技术做得很专业。

----中国独特的文化造成了英文搜索引擎进军国内的壁垒,因为中文没有词的概念,表现在字之间没有空格,所以需要比较智能的切分技术来判断是什么词。所以并不是国外的产品简单地汉化后我们就能拿来使用,而必须是一开始就为中文开发的产品,这是国内厂商的机会。

----现在国内已经有硅谷动力与Chinaren采用了百度公司的产品。正当记者对两者网页的检索结果是否会完全相同表示担心时,李彦宏打消了记者的疑问,他指出百度提供的不是简单的搜索服务,而是提供了搜索平台,在这个平台上,每一个客户可以根据自己的需求、喜好与终端用户的市场调查来做相应的定制,每个客户最后定制的东西是很不一样的。比如硅谷动力是专业的IT站点,是24小时更新一次、还可以只在专业的IT网站搜索。对于Chinaren,它自己开发了切词的技术,可以进行自然语言提问,这是在百度平台上的再次开发。

----李彦宏总结了百度产品的技术优势:一是信息量大,现在能够检索1000万的网页,而快要建成1500万网页的数据库,在中文搜索引擎中处于绝对领先水平。二是响应速度快,百度的产品平均响应时间在0.3秒左右,在Chinanet 与Cernet上都建有百度的服务器,这在国内搜索引擎是第一家。三是更新速度快,最快能达到24小时更新一次,最慢的也在7天之内。而国内许多搜索引擎还是30天更新一次。最后是相关性,百度使用了超链分析技术,这是李彦宏1996年在美国发明的技术,如果你键入“新浪”,那么首先出来的结果肯定是新浪的主页,接着便是新浪的网页,而许多中文搜索引擎都做不到,因为有许多其他网站的链接指向新浪,而且在描述中也用了新浪这个词。最后是对中文语言文化的理解上,像人名的检索,支持简繁体等,在给大陆服务时将简体网页放在前面,而到港台时就相反,对GBK的支持也是大多数网页一级的检索不支持的。

----说到百度的前途,李宏彦强调自己是最纯正的ASP 的厂商,在纳斯达克市场上,inktomi与百度模式最接近,其搜索技术同时提供给AOL与MSN,即使YAHOO更换搜索引擎的消息公布之后,其市值仍然保持在150亿-200亿美元,比余下的几个门户网站的市值加起来还要多。

【转自:http://www2.ccw.com.cn/2000/0027/0027d04.asp

没有永不过时的解决方案

作者:理查德·蒙森·哈费尔 今天的解决方案会成明天的问题 Today'sSolution Is Tomorrow's Problem 没有人能够预知未来。如果你认为这是普遍真理,那么问题就变成,...

网上找的关于 mapbar 的明文经纬度和密文经纬度互转的文章,可能过时

MapBar中坐标的加密和解密(JS实现) 时间:2007-05-13 23:55来源: 作者: 点击:232次 MapBar中坐标的加密和解密(JS实现) 因为有一朋友问起这个问题,我找了下,...
  • wide288
  • wide288
  • 2014年01月16日 16:45
  • 795

有没有想过 你的数据分析方法可能已经过时?

信息时代,能吃到虫子的已不再是早起的鸟儿,而是那些数据驱动的、早起的鸟儿。像百度、阿里巴巴和腾讯这样的大公司,都在不断囤积数据,因为他们都知道数据是金灿灿的宝贝。 但仅仅囤积数据是不够的。你需要...
  • cpless
  • cpless
  • 2017年11月06日 11:40
  • 283

第84篇ES之php图片转base64位码及调汉王图像识别接口及调搜索引擎接口及删除collection

关键词:更新题库到ES, php图片转base64位码,调汉王图像识别接口, 调搜索引擎接口,删除collection 一、更新题库到ES(四) 1.1 php图片转base64位码 实现了,...

<转> 基于Spark的大数据精准营销中搜狗搜索引擎的用户画像挖掘

转载请注明:转载 from http://blog.csdn.net/u011239443/article/details/53735609  近期参加了CCF举办的“大数据精准营销中搜狗用户画像挖...

搜索引擎开源代码(转)

国外开发的相关程序 1、Nutch 官方网站 http://www.nutch.org/ 中文站点 http://www.nutchchina.com/ 最新版本:Nutch ...

Doclist压缩方法简介 [转者注:搜索引擎设计的倒排索引设计中文档列表的存储压缩]

本文转自:  http://www.searchtb.com/2011/07/doclist-compress.html 本文是作者在学习doclist压缩时的一点总结,希望...

十个图片搜索引擎(转)

下面的十款搜索引擎可以帮你实现,以图找图,以图搜图,以图片搜索相似的图片。   一:http://tineye.com/  Tineye是典型的以图找图搜索引擎,输入本地硬盘上的图片或者...
  • lbd2008
  • lbd2008
  • 2012年05月26日 18:04
  • 641

httpclient过时用的jar包

  • 2017年05月08日 15:59
  • 458KB
  • 下载

一写或许过时的盗密码资料

  • 2011年07月08日 15:21
  • 7KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:搜索引擎没有过时【转】
举报原因:
原因补充:

(最多只允许输入30个字)