使用wget遍历下载http目录

本文介绍了如何利用wget命令下载HTTP目录下的所有文件,包括断点续传、递归下载、保持目录结构等功能,并展示了如何创建网站镜像以及下载网页中特定类型的图片。这些技巧对于网络资源的备份和离线浏览非常实用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

0x00 下载HTTP目录下全部文件

命令

wget -c -r -np -k -L -p www.evil.com/samples/

执行后wget会创建一个该网站名称的目录保存递归下载的全部文件。这种下载的方式的好处是保持原有目录结构,条理清晰。

参数解释

-c 断点续传
-r 递归下载,默认深度是5层,可以通过-l参数指定depth。
-np --no-parent 递归下载时不访问父级目录,能够有效的控制下载范围。
-nd 递归下载时不会递归创建目录,会把所有的文件保存到一个目录里。
-k 转换下载网页中的链接,如果下载了链接资源,会转换成相对路径,如果链接是外部资源或者没下载,就会转换成绝对路径。好处是下载后可以脱机浏览,是个比较有用的参数。
-L 递归下载时只取同一主机下的相对资源。
-p 下载遍历到的网页中所有的文件资源,保证超过深度限制的资源被下载。
-P 指定下载目录

0x01 下载整个网站做镜像

命令

wget -r -p -np -k http://www.wooyun.org

或者

wget -m -L -k -p http://www.wooyun.org

0x02 下载特定网页的全部图片

命令

wget -p -A jpg,png https://www.anquanke.com/post/id/220507 -P newdir
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值