- 博客(6)
- 收藏
- 关注
原创 python:error trying to connect: 远程主机强迫关闭了一个现有的连接。 (os error 10054)
这个错误信息表明在连接过程中发生了连接重置错误。排除以上原因:查看自己的chromedriver是否放错位置。
2023-11-03 10:12:07 3339
原创 重生之我在学计算机学得想升天1.3
桥接模式:虚拟机的网络接口直接连接到物理网络中,虚拟机可以获得一个与物理网络中其他设备相同的IP地址,可以与其他设备进行通信。NAT模式:虚拟机的网络接口连接到虚拟网络中,虚拟机可以通过主机的IP地址访问外部网络,但外部网络无法直接访问虚拟机。进入root账户,输入自己的密码,打开操作窗口(单击鼠标右键),点最下面的那一条Open Terminal。仅主机模式:虚拟机的网络接口只能与主机进行通信,无法与其他设备进行通信。虚拟机网络配置(别怪我不想弄些难的高级的)这步做好之后打开虚拟机,在虚拟机里面设置。
2023-10-15 16:49:03 85
原创 重生之我在学计算机之1.2版本
码登录:确保所有集群节点之间可以通过SSH进行通信,并设置免密码登录。配置文件:将配置好的Hadoop配置文件通过SCP或其他工具分发到所有节点上,确保每个节点上的配置文件都是相同的。要配置Hadoop集群,首先需要安装Hadoop并进行一些基本设置。:从Apache Hadoop官方网站上下载最新版本的Hadoop,并按照官方文档提供的说明进行安装。:在每个节点上设置Hadoop的环境变量,以便系统能够找到Hadoop的安装目录和其他必要的配置文件。Hadoop集群:在主节点上运行。
2023-09-30 03:25:06 80
原创 重生之学渣苦学计算机 1.0版本
两者可以结合在一起,Hadoop提供分布式集群和分布式文件系统,Spark可以依附在Hadoop的HDFS代替MapReduce,弥补MapReduce计算能力不足的问题。Hadoop的MapReduce是分步对数据进行处理的,从磁盘中读取数据,进行一次处理,将结果写到磁盘,然后在从磁盘中读取更新后的数据,再次进行的处理,最后再将结果存入磁盘,这存取磁盘的过程会影响处理速度。计算速度快:因为spark从磁盘中读取数据,把中间数据放到内存中,完成所有必须的分析处理,将结果写回集群,所以spark更快。
2023-09-24 01:32:37 77 1
原创 Pythoy 与爬虫的知识点归纳
第二周学习多参数设置:(在第一周所学的内容上递进) 步骤:1.请求开头 2.拼绘(新学的知识点)3.设置请求开头以及传递参数 4.打印请求地址 注意反爬取,列如京东,(可以用代理ip)第三周学习多参数设置:1.请求开头 2.地址 3.豆瓣网址 4.定义要传递多参数 5.设置请求方式和请求头,以及传递参数 6.打印请求地址 7.打印状态码(注意参数设置)第一周学习使用python爬取网络图片:步骤1.请求开头 2.输入所爬取图片的网址 3.写入数据 4.运行代码 5.爬取成功(如爆红则查找错误)
2023-09-17 21:50:23 61
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人