我想请求一个rss程序的帮助。我所做的是收集包含我项目相关信息的网站,然后检查它们是否有rss提要。
链接存储在txt文件中(每行一个链接)。
因此,我有一个txt文件,其中包含了需要检查rss的基本url。在
我找到了这个代码,这会使我的工作更容易。在import requests
from bs4 import BeautifulSoup
def get_rss_feed(website_url):
if website_url is None:
print("URL should not be null")
else:
source_code = requests.get(website_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text)
for link in soup.find_all("link", {"type" : "application/rss+xml"}):
href = link.get('href')
print("RSS feed for " + website_url + "is -->" + str(href))
get_rss_feed("http://www.extremetech.com/")
但是我想从txt文件中打开我收集的url,而不是逐个键入每个url。在
所以我试着用这个来扩展程序:
^{pr2}$
但这返回一个错误,即beauthoulsoup不是http客户端。在
我还扩展了以下内容:def open()
f = open("file.txt")
lines = f.readlines()
return lines
但这给了我一个用“,”分隔的列表
如果有人能帮助我,我将非常感激