使用Feed43为网页生成RSS订阅源

简介

在我们使用Rss时候发现很多的网站并不支持Rss服务,如果自己使用Rsshub,Huginn等搭建订阅源,不单单需要懂一些编程和服务器部署的知识,还需要买服务器。如果只是轻度的使用那么完全可以试试FEED43,通过FEED43提供的免费服务可以为静态网页生成订阅源。

步骤总览

  1. 准备好需要解析的网站网址(必须是服务端渲染页面网站,也就是常说的静态网页)。
  2. 注册好Feed43的账号,并登录。
  3. 使用Feed43解析网页源码。
  4. 分析网页源码,找到哪一动态部分内容是自己需要的。
  5. 根据分析出来的自己需要获取的动态内容编写提取规则。
  6. 根据提取出来的内容调整优化提取规则。
  7. 将提取出来的内容匹配到信息流。
  8. 生成Rss订阅源,完成订阅。

准备好网址

这里我们用电脑爱好者这个网站,我们需要爬取这一个列表里面的内容。

必须是服务端渲染页面网站,也就是常说的静态网页。网页端渲染的页面是无法获取内容的。

注册账号

  1. Feed43官网注册好账号。
  2. 打开Feed43官方网站,点击Create your first RSS feed。

使用Feed43解析出网页源码

image.png

填入网址进行解析:

点击 Reload,你就会在下面的选框中看到当前网页的源代码了。

分析网页源码

Feed43 它会自动捕捉一些标记标题的源码,并标识成粉红色,当然也不是很准确,需要自己酌情修改。通过比对源码我们发现,有如下代码是一致的,只是内容不同,也就是我们需要的列表里面的内容:

<a href="https://www.cfan.com.cn/2022/0411/136391.shtml" target="_blank" title="系统小技巧:按需显示 文件夹查看方式我做主">
<div class="left-post-pic" style="background:url(https://upload.cfan.com.cn/2022/0411/1649641391945.png)no-repeat center;background-size:cover;"></div>
<div class="left-post-info" style="position:relative;">
<h1 class="left-post-title">系统小技巧:按需显示 文件夹查看方式我做主</h1>
<div class="left-post-txt">为了便于查看和整理文件,我们经常会对文件夹的查看方式进行专门的设置,比如查看图片文件夹习惯于使用缩略图的方式,查看文档则喜欢使用列表形式,而对于文档、图片混合的...</div>
</a>

定义提取规则

定义提取规则。将标题、链接等变化的字段删去用{%}代替。将固定且多余的字段删去用{*}代替。源码中有换行的地方均需要添加{*}

<a href={%} {*} title={%}>{*}
<div class="left-post-pic" style="background:url({%})no-repeat center;background-size:cover;"></div>{*}
<div class="left-post-info" style="position:relative;">{*}
<h1 class="left-post-title">{%}</h1>{*}
<div class="left-post-txt">{%}</div>{*}
</a>{*}

检查匹配规则

将上一步我们定义好的规则进行填入:

显示绿色的OK (N items found),则代表成功了。看一看抓取到的内容是否有格式错误的地方。如果没有抓取到内容,或者有格式错误,则需要继续仔细分析然后进行调整。

匹配信息流数据

这一步需要将定义提取规则获取到的动态内容和我们Rss信息流匹配起来,Item Title Template(标题)、Item Link Template(链接)、Item Content Template(全文内容),将第二步获取到的内容输入,{%数字}的形式

生成Rss订阅源


当然,你也可以随时修改或者删除此RSS订阅源。

总结

使用 Feed43 最大的好处就是,不需要自己搭建服务器就可以将那些不支持 RSS 的页面变成 RSS 方便订阅。Feed43的缺点,免费版只会每6小时抓取一次,每次只提取20条消息。

 主要功能和特点:    1、自定义网站信息。    2、自定义数据库信息,可以对多个已经存在的数据库进行操作。    3、2.0A目前可以连接ACCESS、SQL Server两种类型的数据库。    4、自定义数据库结构,以实现对任意数据库、任意字段、任意多数据的RSS降序输出和随机输出。    5、可以自定义输出条件。    6、自定义的数据库信息可以保存、修改、删除。    7、自定义的输出项目可以保存、修改、删除、生成(或更新)XML文件。    8、增强的查错程序,对于用户的输入错误有提示和一部分纠正功能。    9、根据自定义项目输出的XML文件为标准XML格式,可被所有RSS阅读器阅读。    10、输出的XML文件为静态文件,非动态存取,降低占用系统资。    11、可以自定义存放XML文件的文件夹,可以自定义每一个项目生成的XML文件名。    12、完全支持后台生成静态页面网站的需求,可自定义静态页面的字段以及URL构成形式。    13、可以自定义FSO组件的名称,满足了那些修改过FSO组件名称的网站的需求。    14、所有RSS输出项目均可以随意调用,免去每次更新网站后需要手工输出的麻烦。  更新记录:  2005年6月27日:     v2.0A(SQL Server、Access通用版本)Build 20050627     增加了自定义FSO组件名称的功能,满足那些修改了FSO组件名称后无法使用本系统的用户的需求。     修正了数据库密码长度过短无法输入长密码的问题。     增加了所有输出项目可被自由调用实现自动更新RSS输出的功能。     同时发布Build 20050523到Build 20050627的数据库升级程序。   2005年5月23日:     v2.0A(SQL Server、Access通用版本)Build 20050523     增加了支持后台生成静态页面网站的RSS输出功能,使本系统的通用性进一步扩大。     修正了SQL Server登陆用户只能读取默认数据库的错误,可以读取该用户有读取权限的任意数据库。     同时发布Build 20050511到Build 20050523的数据库升级程序。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值