爬虫100篇 —— 第一篇爬取最火游戏图片

木子李！

已于 2023-03-04 09:10:14 修改

阅读量349

点赞数 1

文章标签：爬虫 python 游戏

于 2023-03-03 17:56:39 首次发布

本文链接：https://blog.csdn.net/2301_76511951/article/details/129324614

版权

本文介绍了网络爬虫的基本工作原理，通过Python的requests模块演示了如何获取网页数据，解析JSON文件，并保存图片。主要步骤包括禁用缓存、请求网页、遍历JSON数据以及使用for循环下载图片。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

爬虫(spider，又网络爬虫)，是指向网站/网络发起请求，获取资源后分析并提取有用数据的程序，从技术层面来说就是通过程序模拟浏览器请求站点的行为，把站点返回的HTML代码/JSON数据/二进制数据（图片、视频）爬到本地，进而提取自己需要的数据，存放起来使用。

首先打开百度搜取想要爬取的网页，鼠标右键点击，选择检测

然后选择网络停用缓存打上对勾，刷新此页面得到一堆数据在里面寻找一个herolist.json

复制网址打开Python编写代码

使用requests模块

import  requests  #模块
地址 = requests.get("--------网址-------")   #请求地址
for c in 地址.json():    #使用for循环遍历获取的信息
    cname = c["cname"] #  获取所有信息的名字
    ename = c["ename"]  #  获取id
    a2=requests.get(f"--------网址-------.jpg")
    with open(f"{cname}.jpg", "wb") as f:  #保存
        f.write(a2.content)

上面就是获得爬取信息的所有步骤，以及代码。