自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 在Linux上恢复误删除的文件或目录

或者是配置集群时,要把文件拷贝到各个机器。接下来我分享的这个是一个集群同步工具xsync。测试xsync,在根目录创建a.txt,再进行分发:xsync a.txt,然后再其他服务器的根目录查看是否有a.txt文件。先检查三台虚拟机的ip地址,以及三台机子的免密是否成功。注:如果想在这台虚拟机任何一个目录下分发文件,就需要添加全局执行,写入所有环境变量的配置。因为我已经安装了,所以出现这些。前提:是有另外的机子有相同的未被删除的内容。,进去就可以添加xsync所在位置了。注:配置文件的内容可以网上找。

2023-10-15 16:26:14 197 1

原创 使用Python对网页图片进行采集

2、打开开发者模式并查找请求头(一般是F12键)1、首先,我们在网页中找到我们要的图片。最后就得到我们想要的图片了。

2023-10-03 19:42:58 70

原创 解决ERROR: Attempting to operate on hdfs namenode as root的方法

输入这个命令,在环境变量中添加下面的配置。当出现这种报错后,我们有两种解决办法。

2023-10-03 18:59:07 258

原创 Python爬虫有用的库:fake-useragent 安装后无法引用解决方法

python常见问题

2023-09-22 10:49:12 1118 1

原创 Python爬虫,请求头User-Agent池,和反爬虫

User-Agent 就是用户代理,是一个特殊字符串头,相当于浏览器的身份证号,我们在利用python发送请求的时候,默认为: python-requests/2.22.0,所以我们在利用爬虫爬取网站数据时,频繁更换它可以避免触发相应的反爬机制。在使用爬虫的时候,很多网站都有一定的反爬措施,甚至在爬取大量的数据或者频繁地访问该网站多次时还可能面临ip被禁,所以这个时候我们通常就可以找一些代理ip,和不用的浏览器来继续爬虫测试。另外,可以使用付费代理IP或使用自己搭建的代理服务器,减少被封几率。

2023-09-18 17:37:03 1976

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除