为什么要研究页面价值

本文主要谈的是互联网页面价值的一系列文章,这篇文章是百度搜索研发部写的,那么就让小丁带大家来自己看看这篇文章。

首先,互联网上的页面是无穷尽的,而搜索引擎的硬件资源是有限的,想用有限的资源去覆盖无穷尽的互联网,我们就需要对页面价值做出判断,不收录那些无检索价值的页面,少收录那些检索价值低的页面。这是页面价值在收录控制方面的应用。这可能就是为什么有人说为什么我的网站没收录,为什么网站页面收录很慢的原因。这就是为什么要研究页面价值的原因所在。

那么接下来思考一下搜索引擎为什么把一个页面排在前面呢?我想只有一个答案,那就是页面价值。所以无论我们研究的是收录还是排名,我们都无法逃避对于页面价值的研究。我们在研究一个页面(一个网址)它有没有价值,它有价值,就被收录。如果它在所有网页参与关键词排名的页面里面它是最有价值的,那么它肯定排第一。那么,搜索引擎蜘蛛如何判断页面价值的呢?它一共有4个判断标准:受众,稀缺,质量和时效性

1、受众

受众群体的大小,即代表了用户检索(搜索)需求的大小。评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。 "受众群体的大小,即代表了用户检索(搜索)需求的大小。"什么意思呢?也就是说我们来看一个关键词,它的检索需求越大,那么它受众越大。我们可以用index.baidu.com查出来。所以受众群体越大的关键词,那么它的搜索次数就越多评价受众的大小主要依据信息发布源的受众和信息内容本身受众两大方面。”也就是说受众的大小=信息发布源的受众+信息内容本身的受众。举个例子,比如我在我的博客发布了一篇文章《页面质量度应用的案例》,那么这篇文章的总共受众就等于重庆SEO小丁的受众(粉丝)和在互联网上对这篇《页面质量度应用的案例》文章有需要的用户。

具体因素包括且不限于:

网站忠实用户群大小

一般来说,拥有自己忠实用户群的知名网站,他们的成功,在于他们的内容和服务,比别人更能吸引和满足用户。从这个角度来说,我们可以推论,拥有更多忠实用户群的网站上的内容,会比忠实用户群较少的网站上的内容,有更多的既有和潜在受众群。(为什么呢?因为大型网站比较小网站的潜在用户要多,用户需求更大)这样的话,忠实用户群大小,就可以变成对站点内资源检索价值的一种衡量指标。(某大型网站某一篇内容质量不是很高,但是依然有好排名的原因,所谓的知名站点,只是代表现在评价,而不是代表未来,如果,说你内容大部分质量是比较低的,它的受众会流失)忠实用户群的好处在于,它是变动的。如果一个网站变差了,那么用户就会用脚投票。超链有过期问题,作弊问题,而虚假用户群作弊(比如刷流量)很难。一般所谓的网站知名度,会和忠实用户群数量密切相关。(所以要持续不断的推广,网站的受众会提升,页面价值就提高了)。

资源分布规律

我们再考虑一个网站内部的资源分布所体现的受众群大小问题。比如新浪新闻首页的那些推介内容。新浪编辑为什么要推这些内容?因为他们认为这些是用户最感兴趣的。那么从索引价值角度而言,相当于有一个庞大的编辑团队,已经对这些内容打上了“符合大众口味”的标签。搜索引擎只需要乐享其成就行了。这样的话,资源相对于某些结构性关键页面(首页、频道页等)的链接深度,也可以成为衡量一个资源受众群大小的指标了。

ps:我们来想一下,一个网站内部资源分布是不是能反映出来呢,那么我们网站内页受众最多的是哪儿呢?当然是首页和频道页。一个网站站内最集中最有价值(受众)的地方在首页,那么,如果我们没有把网站最好的集中在首页,我们的页面价值是不是会下降呢?我想会的。那么大家的最有价值(受欢迎)的页面是不是都在首页呢?比如新浪首页(blog.sin.com.cn),我们随便点一个内页 ,在其内页会有一个弹窗,博客推荐,那么这些编辑为什么把这些文章放在博客推荐里面呢?因为他们认为这些文章是最符合大众口味(最受欢迎)的。还有新浪博客首页为什么要推荐这些文章,也许也是这个原因。所以搜索引擎不用辨别哪些文章最有价值了。这就是为什么网站首页最容易获得良好排名的原因。那么,我们也可以给自己网站做推荐,像一些企业新闻没有必要放在首页,那么你的页面价值会降低,我们可以将pv浏览量高的页面提出来,放在首页。另外一种对于实效性比较强的比如电影站,彩票之类的,将这些时热点性强的文章放在首页。

访问热门度

我们再从访问热门度角度(浏览量)来考虑受众群大小问题。这个是最直接的,当然,它需要第三方的工具(统计如百度统计,cnzz)来获取关键数据。通过这个途径,获取的不应仅仅是需要入口的页面(用户打开的页面),还有用户访问一个网站的访问模式(是跳出了还是继续浏览其他页面)。所以我们要经常看网站的百度热力图。

超链

超链某种程度上也是受众群大小的反映。某个资源的质量越高,接触的受众群越大,那么获得正常链接的数量往往也越大。所以超链接也是受众投票的一个表现。

内容特征

A:我写博客:“传言郭德纲要上春晚了。” B:我写博客:“我今天吃早饭了。”

同样的来源,前者的受众必然高于后者。即:当在发布源相同的情况下,具有公众属性的内容分值会更高。因为受众的大小=信息发布源的受众+信息内容本身的受众,在信息发布源受众相同的情况下,郭德纲这个信息内容肯定要比博主写的"我今天吃早饭了"的内容本身受众要高。”当在发布源相同的情况下,具有公众属性的内容分值会更高“那么这一句怎么理解,什么是公众属性?比如说百度新闻(news.baidu.com)中的新闻热搜词和热点新闻人物就是公众属性。

好了,就讲到这里,下面还没有讲完,下次继续。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值