静态网站下载工具
引言
最近遇到了一个比较好的网站,该网站上有很多有用的编程知识之类的,该网站的编排的很好,类似https://www.w3school.com.cn/是个静态网站,想着将网站全部下载下来,这样就可以离线使用了,也不用担心该静态网站倒闭之类的。
于是在网上找了很多的方法,最终发现了一个最有效,最方便的方式,该方法可以下载静态网站以及其中的img、js、css等资源,使静态网站可以在本地离线运行。于是将其余python的界面相结合,简单继承了一下,最后打包成了exe,这样一个可以下载整站的工具就简单完成了。
将网站html、js、css等静态资源保存的各种方式
以下为在网上找到的各种方法及使用结果
(1) 使用python编写爬虫进行网站下载
python爬虫抓取纯静态网站及其资源
此处方法是使用python编写的爬虫,将当前网页的各个资源js、css等进行下载并在本地重新安排路径,可以在本地访问。但是只能爬取访问的页面,不能整站爬取,可以自行优化,尝试改进实现抓取整个网站的方法。