Python web —— webbrowser + feedparser 网络爬虫刷博器

最新推荐文章于 2023-03-10 09:42:06 发布

shao824714565

最新推荐文章于 2023-03-10 09:42:06 发布

阅读量2.6w

点赞数

分类专栏： ----闲----

----闲---- 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

最近也是闲的无聊逛逛别人博客，无意间发现一个很好玩的东西，决定第一次转载就这样献出吧。

强大的 Python，强大的 Python web。

我们以 csdn 上的博客文章为例，

（1）使用 feedparser 根据 rss 地址，解析前 20 篇博客 url，添加到一个 list
（2）用 webbrowser 迭代打开 list 中的 blog url，
（3）因为网页资源十分地消耗内存，我们设置每打开 5 个 url，则调用 cmd 命令强制终止浏览器进程。

import webbrowser as web
import time
import os
import feedparser

d = feedparser.parse('http://blog.csdn.net/shao824714565/rss/list')
blog_urls = [entry.id for entry in d.entries]

cnt = 0
for url in blog_urls:
    web.open_new_tab(url)
    cnt += 1
    time.sleep(3)
    if not (cnt % 5):
        os.system('taskkill -F -IM SogouExplorer.exe')