过滤式订阅(Filtered RSS)

 RSS 订阅及其方便的完成基于个人的信息获取。但是RSS订阅也存在一个问题,就是无选择的信息推送。当一个频道有信息更新时,所有信息条目会全部推送给订阅者,而实际上,可能只有部分信息是订阅者感兴趣的。可以说,无选择的信息推送在一定程度上给用户带来了新的信息湮没问题。

   通过对RSS2.0协议的分析可以发现,通过对RSS协议进行改进,对信息推送加入查询,过滤,搜索等功能,可以很好的实现有选择的信息推送。

   RSS协议框架的实现通常包括两个部分:RSS服务器和RSS客户端,前者发布信息,后者接受信息,通常就是各种的订阅工具。因此,实现选择的信息推送可以在RSS服务器端和RSS客户两端进行实现。

   在客户端,每个频道增加一个过滤器,以达到“只接受感兴趣的信息”的目的。每个过滤器预设过滤规则,例如文本关键字,更新频道时,只列出符合要求的信息条目。当然,在更新频道时,用户也可以选择全部获取的方式更新内容,这相当于禁用过滤器。

   客户端过滤方式中,频道更新信息仍会全部返回到客户端,只是客户端订阅器根据特定过滤规则在信息条目中进行搜索,筛选,只将符合要求的信息条目显示出来而已。因而,这种方式,只需要在客户端增加过滤功能,而无需修改RSS协议,订阅服务器也无需做任何变动。或者可以看作RSS协议的客户端修正版,即协议规则本身不做改动,而加入客户端的过滤功能要求作为协议的补充。

   而在服务器端过滤方式中,RSS协议需要为每个频道增加一个过滤器属性,用于RSS客户端设置过滤规则。客户端在发出频道更新请求时,也会将频道过滤规则一并发送。这样,服务器就需要按照过滤规则对客户端的更新请求进行处理,即查询并返回只符合过滤规则的信息条目。 在这种方式下,由于RSS协议的变动,因此客户端,服务器端都需要做相应的改变。客户端要能发送频道过滤规则,而服务器需要识别频道过滤规则,并且完成搜索过滤功能,因此,服务器需要承担大量的运算任务,但向客户端的数据传输量将极大的减少。

   至于过滤器,目前最主要的方式是基于文本的关键字搜索。搜索范围包括信息条目的标题,信息类型,作者,发布者,关键词,摘要以及正文和参考文献。过滤规则分析可以使用目前成熟的文本搜索技术。

   结合RSS订阅的特点,以及考虑目前互连网海量信息的现状来说,信息条目的分类,应该能够对海量信息搜索起到关键作用。其关键是有一个共同遵循的信息分类标准,这个标准不应该是政治,科学,文化这样单层的,而应改是多层的,例如科学下又分自然,社会,自然下又分天文,物理,生物等;这个标准不应该是一维的,而应该是多维的,例如有学科分类,表现形式等多中分类标准。因而,这个标准应该是一个多层,多维的信息分类标准。每个信息条目都有一个遵循这样的分类标准的标识,结合目前成熟的关键词搜速,将极大的提高搜索和过滤的质量。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值