GitHub 地址:github.com/96chh/crawl…
功能
爬取知识星球的精华区,并制作成 PDF 电子书。
效果图
用法
if __name__ == '__main__':
start_url = 'https://api.zsxq.com/v1.10/groups/454584445828/topics?scope=digests&count=20'
make_pdf(get_data(start_url))
复制代码
把 start_url 改为你需要爬取的星球的相应 url 。
还有安装好 wkhtmltox ,参考后面的「制作 PDF 电子书」。
模拟登陆
爬取的是网页版知识星球