【python--爬虫】爬取wanimal图片

最新推荐文章于 2024-04-04 09:58:51 发布

满眼清香

最新推荐文章于 2024-04-04 09:58:51 发布

阅读量4.3k

点赞数

分类专栏： # python 文章标签： python 自学

本文链接：https://blog.csdn.net/weixin_44037416/article/details/98478760

版权

本文介绍如何使用Python进行网络爬虫，详细解析爬取wanimal博客中的图片流程，包括请求发送、响应处理及图片保存等步骤，适合Python初学者学习。

摘要由CSDN通过智能技术生成

爬取wanimal图片

from urllib.request import urlopen, urlretrieve
from bs4 import BeautifulSoup
from urllib.error import URLError, HTTPError
import requests

class Wanimal:

    def __init__(self, page):
        self.page = page
        self.imgs = []

    def getPage(self, page):
        try:
            html = urlopen("http://wanimal1983.org/page/"+str(page))
            bsobj = BeautifulSoup(html, "html.parser")
            return bsobj
        except (URLError, HTTPError) as e:
            print (e)
            return None

    def getImages(self, page):
        print ("正在加载第%d页" % page)
        bsobj = self.getPage(page)
        imgTags = bsobj.findAll("div", {"class": "photo-sets"})
        self.imgs = []
        for imgTag in imgTags:
            for img in imgTag.findAll("img"):
                self.imgs.append(img)

    def