python网络爬虫——爬取人民邮电出版社新书推荐信息

张謹礧

于 2023-10-30 19:58:50 发布

阅读量921

点赞数

分类专栏： python网络爬虫文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/weixin_66547608/article/details/134126857

版权

python网络爬虫专栏收录该内容

10 篇文章 5 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了一个Python爬虫程序，用于抓取人民邮电出版社的新书推荐信息并保存到Excel文件。程序利用requests库发送HTTP请求，解析JSON数据，再通过openpyxl库将数据写入Excel。详细步骤包括导入所需库、定义请求URL和头信息、发送GET请求、解析数据、创建Excel文件并保存数据。同时，还定义了一个获取书籍详细信息的辅助函数。

摘要由CSDN通过智能技术生成

这段代码是一个爬取人民邮电出版社新书推荐信息的程序。它使用requests库发送HTTP请求，获取新书列表和每本书的详细信息，然后将数据保存到Excel文件中。具体的步骤如下：

导入所需的库：requests、json和openpyxl。
定义了一个URL变量，用于发送GET请求获取新书推荐列表的数据。
设置请求头信息，包括User-Agent和Cookie。
使用requests库的get()方法发送HTTP请求，并将响应内容解析为JSON格式。
定义了一个函数save_excel()，用于创建Excel文件并保存数据。在该函数中，首先创建一个Workbook对象和一个Worksheet对象。
在Worksheet对象中创建一个标题行，然后遍历新书列表中的每本书，调用json_detail()函数获取每本书的详细信息并保存到Excel中。
最后，使用openpyxl库的save()方法保存工作簿为Excel文件。
定义了一个函数json_detail()，用于获取每本书的详细信息。在该函数中，使用POST方法发送HTTP请求，并通过bookId参数指定要获取的书的ID。
解析响应内容为JSON格式，获取书的作者和折扣价格，并返回这些信息。
在最后调用save_excel()函数，将获取的数据保存到Excel文件中。

代码可以分为以下几个部分进行分块分析：

导入库

import requests
import json
import openpyxl

在这一部分

了解本专栏

超级会员免费看

张謹礧

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
python网络爬虫——爬取人民邮电出版社新书推荐信息

这段代码是一个爬取人民邮电出版社新书推荐信息的程序。它使用requests库发送HTTP请求，获取新书列表和每本书的详细信息，然后将数据保存到Excel文件中。具体的步骤如下：导入所需的库：requests、json和openpyxl。定义了一个URL变量，用于发送GET请求获取新书推荐列表的数据。设置请求头信息，包括User-Agent和Cookie。使用requests库的get()方法发送HTTP请求，并将响应内容解析为JSON格式。定义了一个函数save_excel()，用于创建Exce
复制链接

扫一扫