一款开源且超好用的网站克隆机 HTTrack

最新推荐文章于 2024-08-12 08:31:20 发布

weixin_30340353

最新推荐文章于 2024-08-12 08:31:20 发布

阅读量1.1k

点赞数 3

文章标签： git javascript python ViewUI

原文链接：http://www.cnblogs.com/ECJTUACM-873284962/p/11366672.html

版权

本文介绍了开源工具HTTrack，它是一个网站克隆机，可在离线状态下浏览网站。文章详细阐述了HTTrack的安装和使用，包括在Windows、Linux和MacOS下的安装步骤，并通过克隆网站的示例展示了其操作流程。

摘要由CSDN通过智能技术生成

0x00 前言

我们在学习前端的时候，总是会想着去学习其他人网站是如何制作的，或者我们遇到一些比较有用的知识点的时候，我们可能会选择通过 Ctrl + C / Ctrl + V 去扒下内容，然而我并非是鼓励这种扒网站的行为，不过只要是开源的，不用于商业用途，我觉得大家都可以相互借鉴一下的啦，毕竟重复造轮子的事情就是在浪费时间。而通过 Ctrl + C / Ctrl + V 这种方式过于麻烦，并且现在的图片基本上都有防盗链了，或者路径由图床改成了本地的相对路径，单纯的复制粘贴很难把网站的相关内容扒的干净，于是我们有了如下的思考：如何才能将一个网站的内容完整的 clone 下来呢？

初学的时候，我们通过 view-source:https://xxx.xxx.xxx 这种方式查看网页的源代码，新建一个 index.html 文件，然后将内容复制粘贴到 index.html 内容中，或者直接 wget 下来也是可以的。但就像我上面说的那样，没有办法完整的拷贝网页上的全部内容。随着学习的深入，了解到了 python 爬虫的时候，有过这种实例，但是在实现效果上并不是那么友好。

随着学习的进一步深入，有了专门针对网站克隆的软件，如 WebZip、awwwb.com 等等，据说挺好用的，咱也没试过，咱也不确定啊(多年不用 Windows )。今天我给大家介绍一款开源且超好用的网站克隆机 httrack