一、wget简介
curl和wget都是Linux下常用的下载工具,区别在于,curl可以自定义各种请求参数,所以在模拟web请求方面更擅长;而wget由于支持ftp和递归(recursive)下载,所以在下载文件方面更擅长。类比的话curl好比浏览器,而wget是迅雷。
因为计网实验的原因接触了wget,之前虽也有所耳闻但是却只知有这个下载工具,不知怎么使用,有什么功能。下面总结一下学到的wget常用的命令,以便日后查阅,有需求时深入学习
二、wget的用法
参数 | 说明 | 实例 |
-O | 以指定文件名保存文件 | wegt -O 文件名 网址 |
--limit-rate | 以指定速度下载 | --limit-rate=100k |
-c | 断点续传 | |
-b | 后台下载 | |
-U | 设置User-Agent | |
--mirror | 镜像某个目标网站 | |
-p | 下载页面相关资源 | |
-r | 递归下载所有连接 |
# 镜像下载整个网站并保存
wget -c --mirror -U “Mozilla” -p --convert-links http://doce.python-requests.org
#有用到外部域名的图片或连接。如果需要同时下载就要用-H参数。
wget -np -nH -r –span-hosts www.xianren.org/pub/path/