使用 wget 下载备份一个 CSDN 账号下的博客文章

2019年10月15日 更新:

CSDN 网站已更新,本文介绍的方法已失效。可以下载下来,但打开具体一篇文章时页面乱码。不清楚 CSDN 做了什么处理,后续有空再研究应对办法。

 

永远要有风险意识,永远不要忘记备份。

自己发布到 CSDN 的博客,大多是没有其他副本的。以防未来的各种意外,值得定期把博客文章备份下来。针对这个问题花了点时间研究了下,于是有了以下解决方案。

Linux 下使用 wget 工具,为避免下载无关内容,指定 URL 匹配模式。示例如下:

wget --mirror --convert-links --adjust-extension --page-requisites --no-parent --accept-regex=https://blog.csdn.net/engrossment/* https://blog.csdn.net/engrossment

这样,一小段时间后就执行完毕,在当前目录下生成一个 blog.csdn.net 的目录,里面就包含了这个账号的博客的全部内容。

不过有一个问题是,这些下载下来的博客文章页面,用浏览器打开之后,过一会儿之后就会跳转到 csdn 首页。解决办法是更改其检测跳转的代码。

进入 blog.csdn.net/engrossment/article/details,执行以下命令:

sed -i "s/onerror/disable-onerror/g" *

稍等一小段时间即可。这样,再重新打开页面就不会自动跳转了。

其实这种方法也可以拉取下载其他人的博客下来,以供离线慢慢研究。

2018-11-22

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Jackindata

多谢认可!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值