python爬取豆瓣图书top250实例学习 2.0（xpath学习）

最新推荐文章于 2023-03-09 13:00:30 发布

LZH0217

最新推荐文章于 2023-03-09 13:00:30 发布

阅读量400

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/weixin_44169557/article/details/104800658

版权

这篇博客介绍了如何使用Python进行豆瓣Top250图书的爬取，重点讲解了XPath的选择和应用。作者通过实例演示了XPath的基本语法，包括选取节点、查找特定节点和选取未知节点的方法，帮助读者掌握XPath在解析网页数据时的高效技巧。

摘要由CSDN通过智能技术生成

python爬取豆瓣图书top250

1.0

用到requests爬虫库，用户代理User-Agent（Chrome的查看方式：地址栏输入about:version，回车），翻页，打印书名。

import requests
from lxml import etree

headers = {
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'
}
fp = open('./info.txt', 'a', encoding='utf-8')
for page in range(0, 226, 25):
    url = 'https://book.douban.com/top250?start={}'.format(page) # 翻页规则
    response = requests

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LZH0217

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python爬取豆瓣图书top250实例学习 2.0（xpath学习）

python爬取豆瓣图书top250用到requests爬虫库，用户代理User-Agent（Chrome的查看方式：地址栏输入about:version，回车），翻页，打印书名。import requestsfrom lxml import etreeheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64;...
复制链接

扫一扫