url为网址,?号之后为请求参数,参数之间使用&符号进行连接
(1)分析有效的url,及数据的形式
静态数据:服务器已经渲染好的内容,直接发送给浏览器,浏览器解释执行
动态数据:如果点击下一页地址栏没有发生任何变化(说明是动态数据) 说明数据是后来被渲染到HTML中的
(2)编写Python代码,向服务器发送请求,获取数据
需要使用到第三方模块 requests(请求),可以模拟浏览器向服务器发送请求,获取响应结果
第三方模块(相当于后下载的美颜相机,安装才能使用),不是Python自带的,需要安装才能使用,安装方式pip install requests
技巧:第三方模块安装的语法 pip install XXXX 使用之前需要先导入
提供商品的编号,使用python程序向服务器发送请求,获取响应数据,根据key获取值,可以得到当前商品的最大评论页数
一个.xlsx文件,称为一个工作簿
一个工作簿中有三个工作表sheet1,sheet2,sheet3
def save(lst):
wk=openpyxl.Workbook() #创建工作簿对象
sheet=wk.active #获取活动表
#遍历列表,将列表中的数据添加到工作表中,列表中的一条数据,在excel中是一行
for item in lst:
sheet.append(item)
wk.save(‘销售数据.xlsx’)
技术本身没有对与错,关键看你用在什么地方