- 博客(5)
- 收藏
- 关注
原创 python爬取网页
,转换成完整的标头,一样进入网络,看为json文件结尾的文件,右击选择复制中的 cURL(bash),然后进入上面的网站复制进去,自己就会生成,然后点击。代理IP为了是防止多次访问网站,对方将禁止我们访问,而代理IP则伪装我们的IP,这里给你们推荐一个免费的代理IP网站 “ 站大爷” (如果你想爬取一页的房子名称,你要观察他们的路径,你会发现他们只有 [ ] 中的数字变化,那你就把 [ ] 全部删掉即可。复制Python后,你要进行修改。这里有一个精确锁定你想要爬取数据的位置,拖动到你爬取的数据位置。
2023-10-15 16:47:17 101 1
原创 python爬取网站的图片
2. 找到图片的地址,你先进入你想要的图片,按 F12 进入开发工具,点击 ‘’元素‘’ 按钮,寻找地址就行了。本人喜欢薛之谦,我就找了个薛之谦图片。按F12进入网络,如果没有启动就按 "CTRL+ R" ,点击名称中一个文件,标头中有请求方式。3. 给包名做个请求,请求方式也是要去网站的开发工具里看,是。6.运行后将会创建一个.jpg 图片包。5. 以字节或者二进制的方式写入文件。它表示writei写入的意思,而。4.给图片名称以及写入格式。
2023-10-06 14:26:22 88 2
原创 Xpath基本用法
XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中的某部分位言。XPath基于XML的树状结构,在XML文档中通过元素和属性进行导航标记。XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。谓语用来查找某个特定的节点或者包含某个指定的值的节点。选取未知节点:XPath 通配符可用来选取未知的 XML 元素。例子:li[2]表示查询 li 标签的第二个元素内容。●中文名 :可扩展标记语言路径语言。二.xpath的用法。
2023-10-06 13:06:07 107 1
原创 虚拟机Linux中Java 、hadoop的安装,以及配置代码
跳出目录选择你想要的压缩文件(jdk 、hadoop),如果 rz 没有跳出来,就输入:yum -y install lrzsz 安装它。首次启动需要格式化 namenode ,格式化之后它会在Hadoop的目录下发现 logs 和 data 文件夹。输入:Java的jdk 、hadoop 路径要输入正确。1.3 设置Java 、 hadoop 配置。创建好目录,最好是好记住的目录路径。1.安装,解压Java、hadoop包。同理解压 hadoop包。2. hadoop 文件配置。
2023-09-24 17:17:16 446 1
原创 linux虚拟机添加 / 删除用户
如果要同时删除用户的主目录和子目录 “userdel -r /home/username”,强制删除 "userdel -rf /home/username",“/home/username”是要删除用户的主目录路径。你也可以进入 home 文件里,在里面输入“rm -rf username”删除文件。2.删除用户输入命令 “userdel username”,而“username"是你所创的用户名。注意:删除用户账号请谨慎,删除了便是永久删除,里面的文件和数据都没有了,所以请把重要的文件和数据备份哦。
2023-09-17 15:11:41 6740 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人