文 | ssw
来源:Python 技术「ID: pythonall」
有小伙伴留言 只需十几行代码,轻松爬取公众号文章
我试了一下,2步就能生成一篇400行的文章:
爬取200篇文章,脚本在print时,按markdown格式进行打印
print('['+标题+']'+'('+url+')','\n')
将打印结果ctrl+a复制到博客里,生成“python技术”公众号的文章列表可以说不费吹灰之力拿到这些文章:
整个操作下来不到一分钟的时间。
如果用复制粘贴的方式工程量就大了,二百篇文章可能需要你点击上千次。
每页5篇文章,200篇的话下滑40页,我点了十来页实在不想继续滚动鼠标了
比较来说,用python批量获取并制作成博文,也便于筛选查找文章。
比如我想查找python技术公众号关于画画的文章,上图的文章列表ctrl+f搜索关键字就能找到相关内容。
python技术公众号的200篇文章,从2021-06-29到现在,看看有没有你要找的内容:
http://ssw.fit/ 阅览室-公众号,可以看到