python3爬取豆瓣图书Top250图片

最新推荐文章于 2024-06-20 11:25:05 发布

宇宙之一粟

最新推荐文章于 2024-06-20 11:25:05 发布

阅读量900

点赞数

分类专栏：不归路之Python 文章标签： python3 爬虫

本文链接：https://blog.csdn.net/yuzhou_1shu/article/details/83579223

版权

不归路之Python 专栏收录该内容

60 篇文章 7 订阅

订阅专栏

本博客只爬取豆瓣图书Top250的图片，各位爱书的小伙伴赶紧学起来，爬完的效果图如下：

在这里插入图片描述

我这段代码的目录结构如下：
在这里插入图片描述
代码在此：

# -*- coding:utf-8 -*-
import requests
from lxml import etree

def spider(num):
    url = 'https://book.douban.com/top250?start=' + str(num)
    html = requests.get(url)

    selector = etree.HTML(html.text)
    pic_url = selector.xpath('//a[@class="nbg"]/img/@src')
    for each in range(0, len(pic_url)):
        pic = requests.get(pic_url[each])
        fp = open('pic\\books\\' + str(num + each) + '.jpg', 'wb')
        fp.write(pic.content)
        print("保存第%d本书成功" % int(each+num))
        fp.close()


if __name__ == '__main__':
    for i in range(10):
        spider(num=i * 25)