前言
本文转载自Jianger's Blog,欢迎来访订阅。本篇属于定制RSS系列终极一弹,是三种方式中自由度最高、定制化最强的,也需要一定的编程能力。附上前两篇链接:1、利用Feed43为网站自制RSS源;2、如何优雅快速地利用Huginn制作专属RSS。开始之前先对比一下以上三种方式:
方法
优势
不足
复杂性
稳定性
定制性
Feed43
快速、便捷、免费
免费版需间隔6小时,部分网站不可用
简单
一般
中
Huginn
快速、安装后可便捷添加
专业化程度偏高,需要服务器
高
高
高
Python
高度定制、占用内存小
专业化程度偏高,不可随意改正
一般
高
极高
看个人需要进行选择,Huginn虽安装麻烦点,但是一个自动化神器,妙用不仅局限于此。
前排提示
Python脚本需要放置在云主机/云服务器上使用,如果你还没有,赶快购置一台吧
需要了解:CSS基础;Python基础;Linux基础命令;利用浏览器开发者工具找到对应内容代码
我的使用环境:腾讯云主机centos7.5,Python2.7(服务器默认已安装的)
开始定制
先上代码,以下代码仅供参考,重要的是学会利用其中的代码和方法。
以下所有操作基于江西师范大学大学教务在线网站
# -*- coding: utf-8 -*-
import datetime
import time
import PyRSS2Gen
from bs4 import BeautifulSoup
import requests
import re
import sys
reload(sys)
sys.setdefaultencoding('utf8')//防止中文乱码
xmlpath='/local/myrss/jxnu.xml' //RSS文件放置地