- 博客(1)
- 收藏
- 关注
原创 python微信公众号文章爬虫 存成PDF版(目前唯一可行办法)
微信公众号爬虫主要通过搜狗微信进行文章搜索,然后依次模拟浏览获取文章网页源码(主要搜狗微信有反爬虫机制,这是我认为唯一可行的办法),通过pdfkit存到本地,每一篇文章大概需要2-4分钟,公众号文章较多的话建议下班跑脚本1.导入基本库(主要用selenium)from selenium import webdriverimport pandas as pdimport numpy as npimport randomfrom time import sleepbase = r'//*[@id
2021-01-08 17:39:24
1641
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人