如何安装和使用webhttrack

最新推荐文章于 2024-10-09 09:27:37 发布

vincentuva

最新推荐文章于 2024-10-09 09:27:37 发布

阅读量2.1k

点赞数 1

分类专栏： Ubuntu

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vincentuva/article/details/82953757

版权

Ubuntu 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

为了全部爬取一个网站，首先想到的是使用wget，但是爬下来的网站有个问题，那就是在看的时候所有超链接没有发生变化，所以考虑着使用一种功能更为强大的工具来抓取网页。那么，搜一下就会发现webhttrack应该是用的非常多的一款工具。

安装
安装过程非常简单，在ubuntu下使用下面的命令即可完成安装：

sudo apt-get install httrack webhttrack

运行
直接在命令行中打开webhttrack，会提示“权限不够”的错误。

接下来使用sudo来执行，结果出现了“–no-sandbox”的错误。

原来这个问题是跟浏览器相关，因为我系统中默认的浏览器使用的是chrome，而且在运行chrome的时候，必须要使用“–no-sandbox”，所以，需要使用firefox浏览器来解决这个问题。

编辑/usr/bin/webhttrack，同时设置

BROWSEREXE="firefox"

并且注释掉SRCHBROWSEREXE。然后，就可以看到：
在这里插入图片描述

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。