最近用Python写了个备份Blog的程序,算是我的Python练手之作,难免有些性能,健壮性方面的问题,不过,我在网络速度良好的情况下测试该程序,运行还算比较满意。目前只能备份CSDN Blog,不过稍加修改,就能备份Donews Blog。
实现方法就是解析网页,提取出每篇文章的内容,保存到本地文件系统中。和limodou大哥的Blog备份脚本的实现方法不同,他用的是XMLRPC。
使用方法很简单,该程序是基于命令行模式的,在命令行窗口中键入
python backupblog.py [your blog url] [file type]
your blog url 就是你的Blog的地址,file type就是要保存到本地的文件类型,目前支持txt和html两种,它是个可选项,默认是html。举几个例子来看看,
python backupblog.py ----
这就是备份我自己的Blog啦
python backupblog.py http://blog.csdn.net/myan html ---- 这是备份孟岩的Blog,并且保存成html类型
python backupblog.py http://blog.csdn.net/myan html ---- 这是备份孟岩的Blog,并且保存成html类型
如果运行过程中出现编码错误问题的话,在你的Python安装目录->Lib->site-packages中增加一个sitecustomize.py文件,内容为:
# sitecustomize.py
# this file can be anywhere in your Python path,
# but it usually goes in ${pythondir}/lib/site-packages/
import sys
sys.setdefaultencoding('utf-8')
# this file can be anywhere in your Python path,
# but it usually goes in ${pythondir}/lib/site-packages/
import sys
sys.setdefaultencoding('utf-8')
在这里下载BackupBlog.rar