如何從網站上下載php文件,ubuntu - 如何使用wget從網站下載所有文件(而不是HTML)？ - Ubuntu問答...

独自冷静的时光

于 2021-04-14 20:46:44 发布

阅读量109

点赞数

文章标签：如何從網站上下載php文件

本文详细介绍了如何使用wget过滤特定文件类型（如pdf、jpg）下载网站内容，包括多种方法：镜像站点、排除特定扩展名、递归下载和指定文件类型。重点在于获取除HTML、PHP等之外的文件，提供了实用命令实例。

摘要由CSDN通过智能技术生成

問題描述

如何使用wget並從網站獲取所有文件？

我需要除HTML，PHP，ASP等網頁文件之外的所有文件。

最佳方法

要過濾特定的文件擴展名：

wget -A pdf,jpg -m -p -E -k -K -np http://site/path/

或者，如果您喜歡長選項名稱：

wget --accept pdf,jpg --mirror --page-requisites --adjust-extension --convert-links --backup-converted --no-parent http://site/path/

這將鏡像站點，但是沒有jpg或pdf擴展名的文件將被自動刪除。

次佳方法

這為我下載了整個網站：

wget --no-clobber --convert-links --random-wait -r -p -E -e robots=off -U mozilla http://site/path/

第三種方法

wget -m -p -E -k -K -np http://site/path/

手冊頁將告訴您這些選項的作用。

wget將僅跟隨鏈接，如果索引頁麵中沒有指向文件的鏈接，則wget將不知道其存在，因此不會下載。即。如果在網頁或目錄索引中鏈接了所有文件，則將很有幫助。

第四種方法

我試圖下載從Omeka’s themes page鏈接的zip文件-非常相似的任務。這對我有用：

wget -A zip -r -l 1 -nd http://omeka.org/add-ons/themes/

-A：僅接受zip文件

-r：遞歸

-l 1：一層深(即，僅直接從此頁麵鏈接的文件)

-nd：不創建目錄結構，隻需將所有文件下載到此目錄中。

關於-k，-K，-E等選項的所有答案可能都不是真正理解該問題的方法，例如用於重寫HTML頁麵以形成本地結構，重命名.php文件等的問題。沒有關聯。

要從字麵上獲取除.html等之外的所有文件，請執行以下操作：

wget -R html,htm,php,asp,jsp,js,py,css -r -l 1 -nd http://yoursite.com

第五種方法

您可以嘗試：

wget --user-agent=Mozilla --content-disposition --mirror --convert-links -E -K -p http://example.com/

您還可以添加：

-A pdf,ps,djvu,tex,doc,docx,xls,xlsx,gz,ppt,mp4,avi,zip,rar

接受特定擴展名，或僅拒絕特定擴展名：

-R html,htm,asp,php

或排除特定區域：

-X "search*,forum*"

如果機器人(例如搜索引擎)忽略了這些文件，則還必須添加：-e robots=off

第六種方法

嘗試這個。它總是對我有用

wget --mirror -p --convert-links -P ./LOCAL-DIR WEBSITE-URL

第七種方法

wget -m -A * -pk -e robots=off www.mysite.com/

這將在本地下載所有類型的文件並從html文件指向它們，並且它將忽略漫遊器文件

參考資料

独自冷静的时光

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。