- 博客(5)
- 收藏
- 关注
原创 在Linux上恢复误删除的文件或目录
或者是配置集群时,要把文件拷贝到各个机器。接下来我分享的这个是一个集群同步工具xsync。测试xsync,在根目录创建a.txt,再进行分发:xsync a.txt,然后再其他服务器的根目录查看是否有a.txt文件。先检查三台虚拟机的ip地址,以及三台机子的免密是否成功。注:如果想在这台虚拟机任何一个目录下分发文件,就需要添加全局执行,写入所有环境变量的配置。因为我已经安装了,所以出现这些。前提:是有另外的机子有相同的未被删除的内容。,进去就可以添加xsync所在位置了。注:配置文件的内容可以网上找。
2023-10-15 16:26:14
197
1
原创 使用Python对网页图片进行采集
2、打开开发者模式并查找请求头(一般是F12键)1、首先,我们在网页中找到我们要的图片。最后就得到我们想要的图片了。
2023-10-03 19:42:58
70
原创 解决ERROR: Attempting to operate on hdfs namenode as root的方法
输入这个命令,在环境变量中添加下面的配置。当出现这种报错后,我们有两种解决办法。
2023-10-03 18:59:07
258
原创 Python爬虫,请求头User-Agent池,和反爬虫
User-Agent 就是用户代理,是一个特殊字符串头,相当于浏览器的身份证号,我们在利用python发送请求的时候,默认为: python-requests/2.22.0,所以我们在利用爬虫爬取网站数据时,频繁更换它可以避免触发相应的反爬机制。在使用爬虫的时候,很多网站都有一定的反爬措施,甚至在爬取大量的数据或者频繁地访问该网站多次时还可能面临ip被禁,所以这个时候我们通常就可以找一些代理ip,和不用的浏览器来继续爬虫测试。另外,可以使用付费代理IP或使用自己搭建的代理服务器,减少被封几率。
2023-09-18 17:37:03
1976
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人