RSS 订阅及其方便的完成基于个人的信息获取。但是RSS订阅也存在一个问题,就是无选择的信息推送。当一个频道有信息更新时,所有信息条目会全部推送给订阅者,而实际上,可能只有部分信息是订阅者感兴趣的。可以说,无选择的信息推送在一定程度上给用户带来了新的信息湮没问题。
通过对RSS2.0协议的分析可以发现,通过对RSS协议进行改进,对信息推送加入查询,过滤,搜索等功能,可以很好的实现有选择的信息推送。
RSS协议框架的实现通常包括两个部分:RSS服务器和RSS客户端,前者发布信息,后者接受信息,通常就是各种的订阅工具。因此,实现选择的信息推送可以在RSS服务器端和RSS客户两端进行实现。
在客户端,每个频道增加一个过滤器,以达到“只接受感兴趣的信息”的目的。每个过滤器预设过滤规则,例如文本关键字,更新频道时,只列出符合要求的信息条目。当然,在更新频道时,用户也可以选择全部获取的方式更新内容,这相当于禁用过滤器。
客户端过滤方式中,频道更新信息仍会全部返回到客户端,只是客户端订阅器根据特定过滤规则在信息条目中进行搜索,筛选,只将符合要求的信息条目显示出来而已。因而,这种方式,只需要在客户端增加过滤功能,而无需修改RSS协议,订阅服务器也无需做任何变动。或者可以看作RSS协议的客户端修正版,即协议规则本身不做改动,而加入客户端的过滤功能要求作为协议的补充。
而在服务器端过滤方式中,RSS协议需要为每个频道增加一个过滤器属性,用于RSS客户端设置过滤规则。客户端在发出频道更新请求时,也会将频道过滤规则一并发送。这样,服务器就需要按照过滤规则对客户端的更新请求进行处理,即查询并返回只符合过滤规则的信息条目。 在这种方式下,由于RSS协议的变动,因此客户端,服务器端都需要做相应的改变。客户端要能发送频道过滤规则,而服务器需要识别频道过滤规则,并且完成搜索过滤功能,因此,服务器需要承担大量的运算任务,但向客户端的数据传输量将极大的减少。
至于过滤器,目前最主要的方式是基于文本的关键字搜索。搜索范围包括信息条目的标题,信息类型,作者,发布者,关键词,摘要以及正文和参考文献。过滤规则分析可以使用目前成熟的文本搜索技术。
结合RSS订阅的特点,以及考虑目前互连网海量信息的现状来说,信息条目的分类,应该能够对海量信息搜索起到关键作用。其关键是有一个共同遵循的信息分类标准,这个标准不应该是政治,科学,文化这样单层的,而应改是多层的,例如科学下又分自然,社会,自然下又分天文,物理,生物等;这个标准不应该是一维的,而应该是多维的,例如有学科分类,表现形式等多中分类标准。因而,这个标准应该是一个多层,多维的信息分类标准。每个信息条目都有一个遵循这样的分类标准的标识,结合目前成熟的关键词搜速,将极大的提高搜索和过滤的质量。
过滤式订阅(Filtered RSS)
最新推荐文章于 2023-01-18 12:42:19 发布