上一篇文章,我们已经实现抓取商品第一页的功能,下面来实现翻页的功能。
首先通过类定义三个方法:初始化方法、解析一页的方法、翻页爬取。
class jd_comment(object):
def __init__(self):
pass
def page(self):
pass
def max_page(self):
pass
初始化方法包括请求头、文件所在位置
def __init__(self):
self.headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 11) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
}
self.fp = open('shangpingolun.text', 'w', encoding='utf-8')
解析一页的方法,即是爬取一页的方法:
def page(self, url):
response = requests

本文介绍了如何使用Python实现京东商品评论的翻页爬取。通过定义初始化方法、解析页面方法和翻页爬取方法,详细阐述了爬取过程。在实际操作中遇到JSON格式错误的问题,尝试将页码参数由int转为str后,虽能成功爬取一次,但无法持续解决该问题。目前寻求解决方案。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



