Shrucc-CSDN博客

原创 python微信公众号文章爬虫存成PDF版（目前唯一可行办法）

微信公众号爬虫主要通过搜狗微信进行文章搜索，然后依次模拟浏览获取文章网页源码（主要搜狗微信有反爬虫机制，这是我认为唯一可行的办法），通过pdfkit存到本地，每一篇文章大概需要2-4分钟，公众号文章较多的话建议下班跑脚本1.导入基本库（主要用selenium）from selenium import webdriverimport pandas as pdimport numpy as npimport randomfrom time import sleepbase = r'//*[@id

2021-01-08 17:39:24 1973 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 python微信公众号文章爬虫 存成PDF版（目前唯一可行办法）

空空如也

空空如也

原创 python微信公众号文章爬虫存成PDF版（目前唯一可行办法）