- 博客(24)
- 收藏
- 关注
原创 Hadoop集群搭建代码
在ljc102把ljc102的/opt/module/jdk1.8.0_321目录拷贝到ljc103。在ljc103把ljc102的/opt/module目录下的所有目录拷贝到ljc104。CentOS7.6_LJC_103、CentOS7.6_LJC_104操作步骤同上。同步分发/home/ljc1/bin至ljc103、ljc104。模板虚拟机CentOS7.6_LJC_100的配置完成。在ljc102的/home/ljc1下新建目录bin。在/opt/下创建2个目录,并修改所有者和所在组。
2024-01-30 13:00:36
873
1
原创 JavaScript 10.16练习
2.在上述定义的数组中计算是数字类型元素的个数并计算其平均值;判断是否与数组中里面的元素一致,比如:“白色”,123等。6.定义一个二维数组,并遍历该数组;4.在第2步中定义的数组,接收输入的某个数据,5.定义一个8个数字类型元素数组进行去重。并将其作为关键字与数组各元素进行比较,1.定义一个存放10个元素的数组,在网页中输出每个元素(倒序);并在控制台输出用“|”分隔;(正序)在控制台打印输出,如果是非数字类型的,
2024-01-23 12:40:20
354
1
原创 4a 选填
在网页数据解析中,XPath被广泛用于提取网页元素的定位信息,然后使用定位信息提取网页中的数据。这些数据和信息可以来自各种网站、论坛、博客等,爬虫通过模拟用户浏览网页的行为,自动地抓取网页内容,并将这些内容存储在本地或者数据库中,以便后续的分析和处理。(4)根据验证码的特点,使用相应的技术进行识别。(2)在代码中,导入相关的库或工具,如selenium、pytesseract等。(5)最后,将识别的结果进行处理,如提取出有用的信息、验证识别结果的准确性等。8.在Requests库中,路径表达式是唯一的。
2024-01-09 23:32:47
385
python爬虫运行后出现文字没有图片
2023-10-20
python网络爬虫基础
2023-10-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人