爬取京东商品信息并进行简单的打包

作者: 锋小刀
微信搜索【Python与Excel之交】关注我的公众号查看更多内容


前言

今天就教大家进行程序打包,写个简单的爬虫程序,爬取某东商品数据,并进行打包,让没有python环境的电脑也可以运行。
##分析网页
某东网址:

https://www.jd.com/

该网址是一个动态网站,我们打开开发者工具,进入Network→XHR界面,然后在搜索框输入任一商品,这样会加载出一条get请求的链接。
在这里插入图片描述
向下拉动网页,接着他会再次加载出一条链接,说明一个页面会更新两条链接;当点击下一页时,page会也会随之变动。
在这里插入图片描述
因为两条链接携带的参数不同以及后期要打包程序,所以需要适当修改,删除些不用的参数。

https://search.jd.com/s_new.php?qrst=1&suggest=1.his.0.0&stock=1&page=1&s=1

实战代码

导入模块。

import pandas as pd
import requests
from lxml import etree
import time

创建DataFrame,构建headers,伪装请求头,防止被服务器识别。

df = pd.DataFrame(
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值