自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 HDFS基础文件操作实验

本文基于配置完成的Hadoop集群上,完成hdfs的基本操作,包括文件上传,文件重命名与移动,文件的递归查找,查看文件目录下的文件

2022-10-14 21:16:59 1595 1

原创 基于selenium实现的是收集重庆市大数据工程师薪资水平

因为有些网站使用javascript渲染,所以使用传统的request库无法请求到全部的页面源代码,Selenium 是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等操作。对于一些 JavaScript 渲染的页面来说,这种抓取方式非常有效由此本文基于selenium自动化在edge浏览器上实现的,使用mysql数据库进行数据存储,以便进行数据的分析。...

2022-08-11 19:39:35 605

原创 python3网络爬虫aiohttp实战案例

本文介绍了使用aiohttp库实现异步爬虫爬取网站图书的评论,及其代码的详细解释(案例来源于python3网络爬虫开发实战,本人对其进行了改编)

2022-07-29 10:22:19 571 2

原创 网络爬虫xpath实战案例

使用网络爬虫爬取视频,使用了线程池实现异步爬取,使用xpath提取数据,真实的下载地址提取

2022-07-14 11:09:19 633 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除