自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 网络爬虫,用于从Bing图片搜索结果中下载玫瑰花的图片,下载一页的图片

这段代码是一个网络爬虫,用于从Bing图片搜索结果中下载玫瑰花的图片。以下是代码的各个部分的功能解释:导入库:导入os、re、requests、tqdm和etree,这些库分别用于文件操作、正则表达式、网络请求、进度条显示和HTML解析。发起请求:使用requests.get()函数向Bing图片搜索结果页面发起GET请求,并设置headers来模拟浏览器访问。获取响应:使用res.text获取网页的HTML内容。解析网页:使用etree.HTML()函数将HTML内容解析为可操作的树结构,并使用

2024-07-04 16:35:01 160

原创 爬虫脚本,用于从指定的网站抓取新闻信息,抓取多页

这段代码是一个爬虫脚本,用于从指定的网站抓取新闻信息,并将这些信息存储到一个CSV文件中。以下是代码的各个部分的功能解释:导入库:导入requests用于发起网络请求,导入tqdm用于显示进度条,导入lxml用于解析HTML页面,导入pandas用于处理数据,导入json用于处理JSON数据(这里没有直接使用,可能是为了未来的扩展)。初始化DataFrame:创建一个空的DataFramealldata,用于存储所有爬取到的数据。设置编码格式:将DataFrame保存到CSV文件中,指定文件名和编码

2024-07-04 16:16:53 894

原创 简单的网络爬虫,用于从特定的网页上抓取新闻信息

这段代码是一个简单的网络爬虫,用于从特定的网页上抓取新闻信息,并将这些信息保存到一个CSV文件中。以下是代码的各个部分的功能解释:1. **加载第三方库**:导入`requests`用于发起网络请求,导入`lxml`用于解析HTML页面,导入`pandas`用于处理数据。2. **发起请求**:使用`requests.get()`函数向指定的URL发起GET请求,并设置headers来模拟浏览器访问。3. **获取请求**:使用`etree.HTML()`函数将获取到的HTML内容解析为可操作的树结构

2024-07-04 16:14:40 881

exp10-3.cpp

exp10-3.cpp

2023-03-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除