爬虫实战：爬取京东手机图片并保存到本地

最新推荐文章于 2024-07-22 17:25:13 发布

_小辉同学_

最新推荐文章于 2024-07-22 17:25:13 发布

阅读量1.3k

点赞数 1

分类专栏： python 爬虫文章标签： python html 正则表达式大数据

本文链接：https://blog.csdn.net/qq_45734879/article/details/107863113

版权

该博客介绍了如何使用Python爬取京东手机图片并保存到本地。通过获取网页信息、解析数据，然后利用urllib.request的urlretrieve函数保存图片。过程中提到了正则表达式、BeautifulSoup的使用技巧，以及在保存图片时需要注意的细节。

摘要由CSDN通过智能技术生成

先看一下效果：
在这里插入图片描述

这个爬虫的功能是将京东上的手机图片爬取并保存下来，其思路和我上一篇博客爬取豆瓣大致相同，只是代码实现不太一样。主要分为三步：获取网页信息，解析数据，保存数据。只是这一次保存的是图片 jpg 格式，保存位置在D盘，上一篇是将文本信息保存到Excel。这一次需要用到 urllib.request 模块中的urlretrieve 函数进行本地保存，而保存数据到 Excel 中需要导入 xlwt 模块。废话不多说，上代码：

导入模块：

from urllib import request, error
from bs4 import BeautifulSoup
import re

获取网页信息

def askurl(url):
    try:
        req = request.Request(url)
        req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36')
        respond = request.urlopen(req)
        html &