2019年10月15日 更新:
CSDN 网站已更新,本文介绍的方法已失效。可以下载下来,但打开具体一篇文章时页面乱码。不清楚 CSDN 做了什么处理,后续有空再研究应对办法。
永远要有风险意识,永远不要忘记备份。
自己发布到 CSDN 的博客,大多是没有其他副本的。以防未来的各种意外,值得定期把博客文章备份下来。针对这个问题花了点时间研究了下,于是有了以下解决方案。
Linux 下使用 wget 工具,为避免下载无关内容,指定 URL 匹配模式。示例如下:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent --accept-regex=https://blog.csdn.net/engrossment/* https://blog.csdn.net/engrossment
这样,一小段时间后就执行完毕,在当前目录下生成一个 blog.csdn.net 的目录,里面就包含了这个账号的博客的全部内容。
不过有一个问题是,这些下载下来的博客文章页面,用浏览器打开之后,过一会儿之后就会跳转到 csdn 首页。解决办法是更改其检测跳转的代码。
进入 blog.csdn.net/engrossment/article/details,执行以下命令:
sed -i "s/onerror/disable-onerror/g" *
稍等一小段时间即可。这样,再重新打开页面就不会自动跳转了。
其实这种方法也可以拉取下载其他人的博客下来,以供离线慢慢研究。
2018-11-22