【Python】爬虫入门级实战讲解:爬取商城的商品名称及价格

本文介绍了如何使用Python爬虫获取某某商城的商品名称和价格。首先,通过分析接口信息和使用requests库发起POST请求。接着,运用正则表达式抽取所需数据,将结果整理成目标格式。最后,数据不仅展示在Excel文件中,还进一步存入数据库。文章提供完整代码,包括版本更新,增强了数据展示和存储功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求:

1.对于某某商城,爬取其商品名称和商品价格

2.要求:用户动态输入爬取特定商品;

3.爬取结果导入excel表格,并写入数据库中;

思路:

1.查看搜索商品的接口信息,包括接口名称,接口方法(get/post),接口请求参数,及请求头

2.爬取出来的信息,利用正则表达进行抽取有用信息(商品名称,价格)

3.对抽取出来的信息进行拼接及优化展示

4.总共只需三个函数即可,一个利用requests调用搜索接口,获得返回信息,第二个利用re模块去正则表达规则去提取商品名称和价格,第三个优化展示(美观&直观效果)

步骤:

一。第一步:打开F12查看接口信息,取得接口名称,接口调用方法(post),请求头及参数

函数如下:

其中:(1). headers是请求头,字段Authorization是接口授权,是必须的

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值