批量抓取csdn博客列表文章,简化后转为pdf保存
标签:blog python
简介
这是一个简单的python脚本。目前实现的功能只能将某个指定csdn博客的所有博文精简网页后,只保留标题和内容,然后转为pdf,以博文标题为名称保存在本地。
UPDATE
新版本支持代码高亮插件。
[TODO]
- 添加更多博客支持
- 添加更多格式(如markdown)支持
- 改善字体问题
USAGE
需要安装这些python模块:
BeautifulSoup
pip install BeautifulSoup
需要安装这些软件:
wkhtmltopdf
sudo apt-get install wkhtmltopdf