静态网站下载工具一（主要代码）

吾名招财

于 2021-01-23 15:36:21 发布

阅读量1.7k

点赞数

分类专栏： python应用文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44870829/article/details/113045826

版权

python应用专栏收录该内容

27 篇文章 53 订阅 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了一种有效下载静态网站及其资源的方法，结合Python爬虫和wget工具，能够下载包括HTML、JS、CSS在内的静态资源。通过提供的spiderWZ.py代码示例，可以在本地实现离线访问整个网站。

摘要由CSDN通过智能技术生成

静态网站下载工具

引言
将网站html、js、css等静态资源保存的各种方式
实现静态网站下载工具

引言

最近遇到了一个比较好的网站，该网站上有很多有用的编程知识之类的，该网站的编排的很好，类似https://www.w3school.com.cn/是个静态网站，想着将网站全部下载下来，这样就可以离线使用了，也不用担心该静态网站倒闭之类的。
于是在网上找了很多的方法，最终发现了一个最有效，最方便的方式，该方法可以下载静态网站以及其中的img、js、css等资源，使静态网站可以在本地离线运行。于是将其余python的界面相结合，简单继承了一下，最后打包成了exe，这样一个可以下载整站的工具就简单完成了。

将网站html、js、css等静态资源保存的各种方式

以下为在网上找到的各种方法及使用结果
（1）使用python编写爬虫进行网站下载

python爬虫抓取纯静态网站及其资源
此处方法是使用python编写的爬虫，将当前网页的各个资源js、css等进行下载并在本地重新安排路径，可以在本地访问。但是只能爬取访问的页面，不能整站爬取，可以自行优化，尝试改进实现抓取整个网站的方法。

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

吾名招财

CSDN认证博客专家 CSDN认证企业博客

码龄5年

192: 原创

5846: 周排名

6995: 总排名

23万+: 访问

: 等级

4430: 积分

1720: 粉丝

1980: 获赞

104: 评论

2698: 收藏

私信

关注

热门文章

分类专栏

最新评论

OpenCV基于形状的模板匹配
Helloorld_11: Assertion failed (!model.empty() && "model is empty.") in kcg::KcgMatch::PaddingModelAndMask, file ..\detect\pipei.cpp, line 300 这个错误原因是？
6-5，web3浏览器链接区块链（react+区块链实战）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619286389。
6-5，web3浏览器链接区块链（react+区块链实战）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619284773。
6-5，web3浏览器链接区块链（react+区块链实战）
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619282126。
OpenCV4深度神经网络DNN实战教程
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

吾名招财 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。