RSS 简易信息聚合
什么是RSS?为何使用RSS?
RSS(Really Simple Syndication,简易资讯聚合)是一种消息来源格式规范,用以聚合经常发布更新数据的网站,例如博客文章,新闻,多媒体等的摘要或最新更新讯息。其目的为把新闻标题,摘要(Feed),内容按照使用者的要求,“送”到使用者的面前.RSS摘要可以由RSS阅读器,Feed Reader等软体来阅读。
把新闻标题、摘要(Feed)、内容按照用户的要求,“送”到用户的桌面就是RSS的目的。 RSS一词有时候大体上意为社会性书签,包括各种RSS的不同格式。
RSS摘要可以借由RSS阅读器、feed reader或是aggregator等网页或以桌面为架构的软件来阅读。标准的XML档式可允许信息在一次发布后透过不同的程序阅览。用户借由将网摘输入RSS阅读器或是用鼠标点取浏览器上指向订阅程序的RSS小图标之URI来订阅网摘。RSS阅读器定期检阅是否有更新,然后下载给监看用户界面。
RSS与Sitemap
Sitemap是网站地图,目的是完整呈现网站的所有内容,RSS则是负责列出更新的项目,在定义上是不同的。
而当Googlebot会来爬的时候,你最希望它收到什么资讯呢?不会是整个网站全部的内容吧XD,应该是整个网站最重要或最近更新的项目,因此做RSS只提交更新的页面是相对有用的,做全站的站点地图不见得有太大的意义(而且目前的网站份量都是很大的)。另外
,GoogleBot爬网站的周期是用PR值来订(参考Google爬虫的大揭密 - Googlebot爬文周期)。