Google 技术——PageRank 技术和超文本匹配分析

Google   技术

Google   秉持着开发“完美的搜索引擎”的信念,在业界独树一帜。所谓完美的搜索引擎,就如公司创始人之一   Larry   Page   所定义的那样,可以“确解用户之意,切返用户之需”。为了实现这一目标,Google   坚持不懈地追求创新,而不受现有模型的限制。因此,Google   开发了自己的服务基础结构和具有突破性的   PageRank™   技术,使得搜索方式发生了根本性变化。

Google   的开发人员从一开始就意识到:要以最快的速度提供最精确的搜索结果,则需要一种全新的服务器设置。大多数的搜索引擎依靠少量大型服务器,这样,在访问高峰期速度就会减慢,而   Google   却利用相互链接的   PC   来快速查找每个搜索的答案。   这一创新技术成功地缩短了响应时间,提高了可扩展性,并降低了成本。这也是其他公司一直在效仿的技术。与此同时,Google   从未停止过对其后端技术的改进,以使其技术效率更高。

Google   搜索技术所依托的软件可以同时进行一系列的运算,且只需片刻即可完成所有运算。而传统的搜索引擎在很大程度上取决于文字在网页上出现的频率。Google   使用   PageRank™   技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。在综合考虑整体重要性以及与特定查询的相关性之后,Google   可以将最相关最可靠的搜索结果放在首位。

        *   PageRank   技术:通过对由超过   50,000   万个变量和   20   亿个词汇组成的方程进行计算,PageRank   能够对网页的重要性做出客观的评价。PageRank   并不计算直接链接的数量,而是将从网页   A   指向网页   B   的链接解释为由网页   A   对网页   B   所投的一票。这样,PageRank   会根据网页   B   所收到的投票数量来评估该页的重要性。

            此外,PageRank   还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的   PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google   技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么   Google   会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。

        *   超文本匹配分析:Google   的搜索引擎同时也分析网页内容。然而,Google   的技术并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本)的方式,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素。Google   同时还会分析相邻网页的内容,以确保返回与用户查询最相关的结果。

Google   的创新并不限于台式机。   为了确保通过便携式设备访问网络的用户能够快速获得精确的搜索结果,Google   还率先推出了业界第一款无线搜索技术,以便将   HTML   即时转换为针对   WAP、i-mode、J-SKY   和   EZWeb   优化的格式。
PageRank   0~2
  表示目前未有太多外部连结连到这个网站;但这不意味你的网站在Google那边排名就一定名落孙山。假如您讨论的主题够专,范围够狭窄,还是很有可能网友在Google上面搜寻时,您可以排名在很前面。

  PageRank   3
  一般经营两年以上的网站多能达到这个成绩;这是很不错的成绩,但是在热门搜寻领域里肯定还排不上边。

  PageRank   4
  能达到这个数字,已经证明链接到您的网站外部连结“质”、“量”俱佳。所谓量容易了解,而“质”则是指反向连结本身的PageRank也相当高。

  PageRank   5
  这表示有不少“具权威性”的重量级网站,连结到您的网站;通常Google内部会有一些他们特别重视的大站,如果你能取得这些网站的链接分数就会飙很快。大概此时您的网页内容在搜索引擎排行上就有蛮不错的表现。

  PageRank   6
  据说能突破5到6的网站非常少,从这里开始您的网站已经进入另外一个不同的境界。除了您的反向连结够多也够重量之外,事实上您自己的网站也堂堂是个“很有份量”的大站!

  PageRank   7~10
  从这里开始可以算是“神之领域”了。小弟看过数字上到这的网站,多半是纽约时报(New   York   Times)、Apple.com、Yahoo.com…这种“想当然尔”的大站。台湾的联合报、自由时报、中国时报三大报网站的PageRank也只有6;显见要进入这个领域有多么不容易。个人Blog要达到这个分数,我猜应该是近乎不可能的任务。除非真把Blog当事业,整天冲刺打拼。

  要注意的是PageRank跟网站流量不一定有正相关,也就是说您的网站可能流量不高,但凭借着专业性够,在该领域社群里面很多人认可提供连结,也能造就您极高的PageRank。

  因此对广告主来说,依流量放广告有时候不一定比依PageRank放广告来得有效益,原因在于后者有较低的信息交易成本。

  特别是当广告对象也是小众时,那在PageRank高的小众网站上投放广告很可能有惊人的成效。

  这也是为什么Google的文字广告能够痛击传统的网页广告。
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值