爬虫一：获取豆瓣图书Top250（Requests+XPath）

最新推荐文章于 2023-03-09 13:00:30 发布

VIP文章 Ceres爱吃鱼

最新推荐文章于 2023-03-09 13:00:30 发布

阅读量1.2k

点赞数 2

分类专栏： Python 文章标签：爬虫 Python

本文链接：https://blog.csdn.net/u013378642/article/details/80944070

版权

目的：

获取豆瓣图书Top250的所有书目信息。
豆瓣网址：https://book.douban.com/top250

代码：

import requests
from lxml import etree
import time

for i in range(10):
    url = 'https://book.douban.com/top250?start=' + str(25*i)
    data = requests.get(url).text
    html = etree.HTML(data)
    books = html.xpath('//*[@id="content"]/div/div[1]/div/table')
    for book in

最低0.47元/天解锁文章

优惠劵

Ceres爱吃鱼

关注关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
爬虫一：获取豆瓣图书Top250（Requests+XPath）

一：获取豆瓣图书Top250代码：import requestsfrom lxml import etreeimport timefor i in range(10): url = 'https://book.douban.com/top250?start=' + str(25*i) data = requests.get(url).text html = ...
复制链接

扫一扫