Web2.0之RSS

RSS简介

一、什么是RSS?

  也许大家是第一次听到RSS这个概念,那什么是RSS呢?RSS 是站点用来和其他站点之间共享内容的一种简易方式(也叫聚合内容),通常被用于新闻和其他按顺序排列的网站,例如Blog。一段项目的介绍可能包含新闻的全部介绍等。或者仅仅是额外的内容或者简短的介绍。这些项目的链接通常都能链接到全部的内容。网络用户可以在客户端借助于支持RSS的新闻聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。

  说得更加简单一点,RSS就是一种用来分发和汇集网页内容的XML格式,是一种用于发布和获取网络内容(例如头条新闻)的XML格式。使用RSS阅读器来阅读,你可以不用一个个去开页面,也能够很快地知道关注网络内容更新了没有。如果你还是不太明白,没有关系,RSS是什么其实基本就不重要,重要的是RSS可以做什么,下面我们就来了解一下,RSS能给我们带来什么?

小知识:
   BLOG:BLOG是Web Log的简称。在国内,人们通常称它为博客。它是一种作者与读者以日记风格进行交互的中介。在软件社区,人们以博客形式来共享观念与思想变得越来越流行,人们开始以博客的形式互相学习,博客已经成了一个技术交流的场所!如:http://blogs.msdn.com 就是MSDN上的一个blogging。
   XML:XML是Extensible Markup Language的简写,一种扩展性标识语言。

二、RSS的历史

  那么RSS究竟代表什么呢?比较普遍的有两种说法,一种是“Rich Site Summary”或“RDF Site Summary”,另一种是“Really Simple Syndication”,之所以有这些分歧,需要从RSS发展的历史说起。

  最初的0.90版本RSS是由Netscape公司设计的,目的是用来建立一个整合了各主要新闻站点内容的门户,但是0.90版本的RSS规范过于复杂,而一个简化的RSS 0.91版本也随着Netscape公司对该项目的放弃而于2000年暂停。
   不久,一家专门从事博客写作软件开发的公司UserLand接手了RSS 0.91版本的发展,并把它作为其博客写作软件的基础功能之一继续开发,逐步推出了0.92、0.93和0.94版本。随着网络博客的流行,RSS作为一种基本的功能也被越来越多的网站和博客软件支持。
   在UserLand公司接手并不断开发RSS的同时,很多的专业人士认识到需要通过一个第三方、非商业的组织,把RSS发展成为一个通用的规范,并进一步标准化。于是2001年一个联合小组在0.90版本RSS的开发原则下,以W3C新一代的语义网技术RDF(Resource Description Framework)为基础,对RSS进行了重新定义,发布RSS1.0,并将RSS定义为“RDF Site Summary”。但是这项工作没有与UserLand公司进行有效的沟通,UserLand公司也不承认RSS 1.0的有效性,并坚持按照自己的设想进一步开发出RSS的后续版本,到2002年9月发布了最新版本RSS 2.0,UserLand公司将RSS定义为“Really Simple Syndication”。

  目前RSS已经分化为RSS 0.9x/2.0和RSS 1.0两个阵营,由于分歧的存在和RSS 0.9x/2.0的广泛应用现状,RSS 1.0还没有成为标准化组织的真正标准。

三、RSS可以干什么?

  1.订阅BLOG(BLOG上,你可以订阅你工作中所需的技术文章;也可以订阅与你有共同爱好的作者的日志,总之,BLOG上你对什么感兴趣你就可以订什么)
   2.订阅新闻(无论是奇闻怪事、明星消息、体坛风云,只要你想知道的,都可以订阅)

  你再也不用一个网站一个网站,一个网页一个网页去逛了。只要这将你需要的内容订阅在一个RSS阅读器中,这些内容就会自动出现你的阅读器里,你也不必为了一个急切想知道的消息而不断的刷新网页,因为一旦有了更新,RSS阅读器就会自己通知你!

四、RSS阅读器

  目前,RSS阅读器基本可以分为两类。

  第一类大多数阅读器是运行在计算机桌面上的单机应用程序,通过所订阅网站和博客(blog)中的新闻供应,可自动、定时地更新新闻标题。在该类阅读器中,有Awasu、FeedDemon和RSSReader这三款流行的单机版阅读器都提供免费试用版和付费高级版,另外,新华网在不久前也推出了一款RSS阅读器,它不仅是完全是中文界面,而且目前还是完全的免费软件!(后面我们就将以这款软件为例,为大家介绍怎样来使用RSS阅读器)

  第二类新闻阅读器通常是内嵌于已在计算机中运行的应用程序中。例如,NewsGator内嵌在微软的Outlook中,所订阅的新闻标题位于Outlook的收件箱文件夹中。另外,pluck内嵌在Internet Explorer浏览器中!

五、RSS的联合(Syndication)和聚合(Aggregation)

  发布一个RSS文件(一般称为RSS Feed)后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的XML格式,所以也能在其他的终端和服务中使用,如pDA、手机、邮件列表等。而且一个网站联盟(比如专门讨论旅游的网站系列)也能通过互相调用彼此的RSS Feed,自动的显示网站联盟中其他站点上的最新信息,这就叫着RSS的联合。这种联合就导致一个站点的内容更新越及时、RSS Feed被调用的越多,该站点的知名度就会越高,从而形成一种良性循环。

  而所谓RSS聚合,就是通过软件工具的方法从网络上搜集各种RSS Feed并在一个界面中提供给读者进行阅读。这些软件可以是在线的WEB工具,如http://my.netscape.com ,http://my.userland.com , http://www.xmltree.com ,http://www.moreover.com ,http://www.oreillynet.com/meerkat 等,也可以是下载到客户端安装的工具

六、RSS的未来发展

  随着越来越多的站点对RSS的支持,RSS已经成为目前最成功的XML应用。RSS搭建了信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。相信很快我们就会看到大量基于RSS的专业门户、聚合站点和更精确的搜索引擎。

 RSS入门 : RSS初步接触  
  什么是RSS,RSS如何工作,RSS新闻阅读器三大优势,流行的RSS软件,RSS相关词汇。读完此篇文章,可以对RSS有一个基本的了解。

RSS新闻器:互联网上即将到来的革命

  仔细观察一些网站,你可能注意到一些被标记为“XML”或“RSS”橙色图标。


什么是RSS

  RSS是英文Rich Site Summary(丰富站点摘要)或者ReallySimpleSyndication(真正简单的整合)的首字母缩写,是一种用于共享新闻标题和其他Web内容的XML格式。

  RSS起源于20世纪90年代后期,最初是Netscape对Microsoft公司的InternetExplorer做出的回应。IE4刚刚推出来的时候有一个有趣的功能,那就是“新闻频道”,为此Netscape定义了一套描述新闻频道的语言,这就是RSS,只不过Netscape自当时起就每况愈下,所以最终也没有发布一个正式的RSS规范(只发布了一个0.9版本)。

  后来,RSS技术被著名的博客DaveWinner的UserLand软件公司所接手,继续开发新的版本,以适应新的网络应用博客的需要。

RSS如何工作

  您一般需要下载和安装一个RSS新闻阅读器或汇集器,然后从罗列成千上万网站的目录列表中订阅您喜爱的网站的内容。

  一旦登录后,您将看到所订阅的每个频道的最新内容——新闻标题、摘要,而且有时看到完整的报告和一两幅照片。你甚至可以点击链接直接进入那个网站,找到新闻的最初来源地。许多RSS软件运行在Web浏览器内部,而另一些则是独立的程序。而且多数程序是免费的。

  以苹果MAC机上使用的NetNewsWire软件为例,我们使用一个窗口,一眼就可跟踪60个不同的网站,并且在一些情况下是某些网站中的不同版面上的内容。

  比如我们使用该软件阅读来自Yahoo!网站的新闻报道。由于Yahoo!公布了其RSS提要的地址,我们将这些地址复制到NetNewsWire应用程序中的命令窗口中。数秒钟内,我们在一个窗口中就得到了一张最新新闻标题的列表,另一个窗口则提供了新闻报道的导语段落。Yahoo!发布了国内、国际和政治新闻版面的不同提要。其他一些提供RSS馈送的新闻机构包括“TheNewYork Times”、Time Warner的CNN.com以及Forbes.com。

  对于使用微软Windows操作系统的用户来说,一种叫做Newsgator的流行应用软件可以在Outlook窗口中汇集你所喜爱的RSS提要。想像一下,由于不必输入网址或搜索收藏菜单中的书签而节省下来的时间吧。RSS提要还能使你掌握希望阅读的网站内容最近是否进行了更新。

  不过,这项技术的潜力不仅只是使Web冲浪狂们的生活更方便。实际上,RSS提要是可以进行搜索的,并且许多博客(blogger)喜欢发表自己的RSS提要,因为这样做可以增加读者数量。而这正是Feedster.com所做的事情。该公司最近在亚利桑那州举行的Demo2004大会上展示了它搜索RSS提要的能力。

  在演示活动那天,有关AlexRodriguez被买给纽约扬基队的新闻几分钟前刚刚传到新闻通讯社。但将他的名字插入到Feedster.com搜索引擎中,不到半小时就收到了多个博客对此新闻发表的评论。Feedster搜索了50来万RSS提要的内容,而且内容每天都在增加。它不仅搜索个人网志(blog)的提要而且还在来自多家主要新闻网站的提要中进行搜索。您听说过但却永远不可能通过Google搜索找到的网志可更加容易地被找到了。

  目前成千上万个网站利用RSS来增加访问自己网站的数据流。这项技术进化成为BBC、NewYorkTimes、Cnet、Salon、ESPN、InfoWorld、The ChristianScienceMonitor和其他许多网站间共享内容的流行手段。
技术标准之争

  今年2月初,Google宣布,其Blogger服务放弃RSS格式而选择了另一种技术Atom,此举进一步加剧了这一技术的标准之争。

  搜索巨头Google去年收购了Blogger.com,今年开始允许用户向其他网站共享其在线日记,并选择新的Atom格式而非过去的RSS。Atom格式是RSS的一种替代格式,由IBM的工程师SamRuby提出。

  RSS与Atom之间的斗争自去年夏季以来将博客世界分裂为两大阵营。实际上,RSS和Atom原理是一致的,目的都在于为Weblog、新闻或是其他Web内容创建XML文本,以便其他站点引用。RSS的支持者包括、News.com的出版商CNETNetworks等。而Google和SixApart(Moveable Type拥有者)则支持Atom。

  现在一些网站同时提供RSS和Atom源,如Yahoo的MyYahoo就是如此。该公司发言人称,“我们将致力于开发自己的RSS阅读器,以使用户能够在其中加入自己认为重要的内容。我们同时支持RSS和Atom,这对于用户而言是最具自由度的。”

  Atom的支持者称,“RSS一直为单个企业或团体所控制。Atom则是一种开放标准,不为任何人所控制。”实际上,根据“创造共用”协议,RSS目前也可让所有人使用,该协议使其不会受到商业版权的影响。“这意味着任何人都可以开发自己版本的RSS。”

  RSS格式协议的主导者、哈佛大学研究员DaveWiner不久前在其Blog(ting.com)上发表言论,称愿意将RSS与其竞争者Atom合并为统一格式。这两种技术合并的难度取决于各自的支持者。Winer和RSS支持者的态度,有助于促使Atom向后兼容RSS。

  据悉,合并进程极有可能在IETF(Internet EngineeringTaskForce)领导之下展开。Atom派有望在该组织于今年8月的圣地亚哥会议上争取到一个工作小组的席位。

  分析人士认为,市场分裂将对目前的RSS 2.0标准产生巨大的影响,不过可能不足以扼杀RSS2.0。而且有业内人士估计,Microsoft或另一位重量级参与者将加入到这场竞赛中,提出某个RSS变种。任何MS-RSS都可能成为未来产品的基础。Microsoft的RSS变种可能在某种程度上会与即将推出的代号为Longhorn的Windows操作系统兼容。

前景不可限量

  其实,技术人员使用RSS程序已有相当长一段时间了。这类程序现在在PC、Mac以及交叉平台上可供普通大众使用。

  现在RSS已经开始为新闻机构、政府和非营利机构——一切的新闻来源所重视和采用。

  RSS目前在出版商和用户中尤其越来越流行。对于出版商来说,RSS是一种提供结构化信息的方法。对于用户来说,RSS是一种在他们需要的地方、时间并以他们希望的方式获得信息的工具。

  使用RSS的网站管理员看到访问自己网站的数据流的增加。利用RSS,他们现在可以以一种更及时的方式收集和分发新闻。

  尽管RSS变得越来越受欢迎,但它不会淘汰Web浏览技术。它的确为新闻机构提供了另一种获得了精通技术的读者途径,为新闻记者建立一条更广泛的新闻网。

  RSS的用途决不局限在新闻阅读上。我们可能甚至看到营销和公关经理利用RSS这种新的方式来联系顾客。

  RSS还可运用在商品交易中,比如eBay,Amazon,或者是SecondhandMarket,用户可根据自己感兴趣的商品进行定制,并且随时掌握最新标价等更新信息。一旦完成交易这个信息也就随之失效,这是商业上的运用,也是对Web的一种辅助。

  2004年3月,在线超市亚马逊(Amazon.com)推出数百个个性化的RSS提要,以供电子商务顾客使用。此举会大大推动RSS格式的发展。Amazon.com继Yahoo!之后开始拥抱RSS,被认为是对消费者使用新闻整合器的巨大推动。
  Amazon.com的RSS提要已经编写出软件,以按照种类和搜索结果提供其网站的内容。该公司称,这些提要将能使用户对具体种类或特定搜索中的10款最畅销商品进行标题式阅读。商品种类包括图书、音乐、DVS、电子产品、玩具和杂志。

  亚马逊公司采用的RSS是由AmazonWebServices提供支持的,这项2002年发布的服务旨在使第三方开发者能通过XML或SOAP访问其数据库。

RSS新闻阅读器三大优势

  1、没有广告或者图片来影响标题或者文章概要的阅读。

  2、RSS阅读器自动更新你定制的网站内容,保持新闻的及时性。

  3、用户可以加入多个定制的RSS提要,从多个来源搜集新闻整合到单个数据流中。

流行的RSS软件

  ADC Software公司的NewzCrawler (适用于Win 95以上操作系统,售价25美元,www.newzcrawler.com)。

  Bradbury Software公司FeedDemon (适用于Win 98以上操作系统,售价30美元www.feeddemon.com)。

  RSSReader (适用于Win 98以上操作系统,免费使用,www.rssreader.com)。

  SharpReader (适用于Win 98以上操作系统,免费使用,www.sharpreader.net)。

  Wildgrape公司的NewsDesk (适用于Win 98以上操作系统,免费使用,www.wildgrape.net)。

  Ranchero Software公司的NetNewsWire Lite (适用于Mac OS X10.1以上操作系统,免费使用,www.ranchero.com)。

RSS相关词汇

  RSS = Really Simple Syndication = Rich Site Summary = RDFSiteSummary

  RSS file = RSS feed = RSS channel = feed = channel(RSS提要)

  Atom = a format similar to RSS; like RSS the files may alsobecalled feeds or channels (Atom,一种与RSS类似的格式,也可以被称为提要)

  XML = eXtensible Markup Language

  RDF = Resource Discovery Framework =RSS 1.0版本格式

  OMPL = Outline Processor Markup Language

  blog = weblog = log on the web = a journal-type website, manyofwhich produce RSS feeds (博客,一种日记性的网站,其中很多会提供RSS提要)

  RSS reader = news reader = RSS aggregator = a program thatcanread RSS files(RSS新闻阅读器,一种可以阅读RSS文件的软件)
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Spring Boot提供了许多属性来配置应用程序,包括抓取RSS的功能。您可以在application.properties或application.yml文件中指定这些属性,也可以通过命令行开关来配置。 要抓取RSS,您可以使用Spring Boot提供的相关类和注解。首先,确保您的项目中已经添加了相关的依赖。在Gradle中,您可以在build.gradle文件中添加以下配置: ```groovy dependencies { implementation 'org.springframework.boot:spring-boot-starter-web' implementation 'rome:rome' } ``` 然后,您可以创建一个Controller类来处理抓取RSS的请求。使用`@RestController`注解标记该类,并使用`@GetMapping`注解指定处理GET请求的方法。在方法中,您可以使用Rome库来抓取和解析RSS。 ```java import org.springframework.web.bind.annotation.GetMapping; import org.springframework.web.bind.annotation.RestController; import com.rometools.rome.feed.synd.SyndFeed; import com.rometools.rome.io.SyndFeedInput; import com.rometools.rome.io.XmlReader; @RestController public class RssController { @GetMapping("/rss") public SyndFeed getRssFeed() { try { String rssUrl = "https://example.com/rss-feed"; // 替换为实际的RSS源URL SyndFeedInput input = new SyndFeedInput(); SyndFeed feed = input.build(new XmlReader(new URL(rssUrl))); return feed; } catch (Exception e) { // 处理异常 return null; } } } ``` 在上面的示例中,我们创建了一个`RssController`类,并在`/rss`路径上定义了一个GET请求的处理方法。该方法使用Rome库来抓取和解析指定的RSS源,并返回`SyndFeed`对象。 请注意,上述示例仅提供了一个基本的框架,您可能需要根据实际需求进行进一步的处理和定制。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值