wget very cool!!!

wget不仅能抓取某个页面,还能对网站做镜像,貌似很不错。这个不就是爬虫吗?而且速度也很快,用来抓取网页格式的文档是不错的。

 

让我们看这条命令:

wget --mirror –w 2 –p --HTML-extension –-convert-links –P ~\wget_files\example1 http://www.yourdomain.com 
  •  --mirror(-m):指定要做镜像的网站。wget会获取网站的所有链接和相关的文件。如果本地镜像存在,还会自动覆盖最近的更新。
  • -w:告诉wget每个请求的间隔时间,这里是2秒。这个不是必需的,当有些站点对请求间隔有限制时,这个参数就非常有用了。
  • -p:让wget获取页面上的所有元素,使其能在本地浏览。--mirror参数并不会保证所有的图片及相关文件都被下载,所以需要加上-p来指定。
  • --HTML-extension:将所有不是html扩展名的文件都转换成.html。这个参数会把CGI,ASP,PHP等结尾的文件都转换成html结尾。
  • -P(prefix folder):指定目标文件夹。

还可以备份ftp:

wget –mirror –w 3 –p –P ~\wget_files\example2 ftp://username:password@ftp.yourdomain.com

 

当然下载文件更没问题了:

Wget –P c:\wget_files\example3 http://ftp.gnu.org/gnu/wget/wget-1.9.tar.gz 

 

不过备份站点的话,可能用rsync更好的一点吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值