珺濤-CSDN博客

原创 python爬取网页

，转换成完整的标头，一样进入网络，看为json文件结尾的文件，右击选择复制中的 cURL(bash)，然后进入上面的网站复制进去，自己就会生成，然后点击。代理IP为了是防止多次访问网站，对方将禁止我们访问，而代理IP则伪装我们的IP，这里给你们推荐一个免费的代理IP网站 “ 站大爷” （如果你想爬取一页的房子名称，你要观察他们的路径，你会发现他们只有 [ ] 中的数字变化，那你就把 [ ] 全部删掉即可。复制Python后，你要进行修改。这里有一个精确锁定你想要爬取数据的位置，拖动到你爬取的数据位置。

2023-10-15 16:47:17 101 1

原创 python爬取网站的图片

2. 找到图片的地址，你先进入你想要的图片，按 F12 进入开发工具，点击 ‘’元素‘’ 按钮，寻找地址就行了。本人喜欢薛之谦，我就找了个薛之谦图片。按F12进入网络，如果没有启动就按 "CTRL+ R" ，点击名称中一个文件，标头中有请求方式。3. 给包名做个请求，请求方式也是要去网站的开发工具里看，是。6.运行后将会创建一个.jpg 图片包。5. 以字节或者二进制的方式写入文件。它表示writei写入的意思，而。4.给图片名称以及写入格式。

2023-10-06 14:26:22 88 2

原创 Xpath基本用法

XPath即为XML路径语言，它是一种用来确定XML（标准通用标记语言的子集）文档中的某部分位言。XPath基于XML的树状结构,在XML文档中通过元素和属性进行导航标记。XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。谓语用来查找某个特定的节点或者包含某个指定的值的节点。选取未知节点：XPath 通配符可用来选取未知的 XML 元素。例子：li[2]表示查询 li 标签的第二个元素内容。●中文名：可扩展标记语言路径语言。二.xpath的用法。

2023-10-06 13:06:07 107 1

原创虚拟机Linux中Java 、hadoop的安装，以及配置代码

跳出目录选择你想要的压缩文件（jdk 、hadoop），如果 rz 没有跳出来，就输入：yum -y install lrzsz 安装它。首次启动需要格式化 namenode ，格式化之后它会在Hadoop的目录下发现 logs 和 data 文件夹。输入：Java的jdk 、hadoop 路径要输入正确。1.3 设置Java 、 hadoop 配置。创建好目录，最好是好记住的目录路径。1.安装，解压Java、hadoop包。同理解压 hadoop包。2. hadoop 文件配置。

2023-09-24 17:17:16 446 1

原创 linux虚拟机添加 / 删除用户

如果要同时删除用户的主目录和子目录 “userdel -r /home/username”,强制删除 "userdel -rf /home/username",“/home/username”是要删除用户的主目录路径。你也可以进入 home 文件里，在里面输入“rm -rf username”删除文件。2.删除用户输入命令 “userdel username”,而“username"是你所创的用户名。注意：删除用户账号请谨慎，删除了便是永久删除，里面的文件和数据都没有了，所以请把重要的文件和数据备份哦。

2023-09-17 15:11:41 6740 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 python爬取网页

原创 python爬取网站的图片

原创 Xpath基本用法

原创 虚拟机Linux中Java 、hadoop的安装，以及配置代码

原创 linux虚拟机添加 / 删除用户

空空如也

空空如也

原创虚拟机Linux中Java 、hadoop的安装，以及配置代码