爬取jd销量最高的商品名称和评论数

该博客介绍了如何爬取京东网站上销量最高的商品名称及其对应的评论数量,通过详细步骤和代码实例,展示了网络爬虫在电商数据分析中的应用。
摘要由CSDN通过智能技术生成

参考博客:

https://blog.csdn.net/menghuannvxia/article/details/51333689

代码:

import requests
import re
from urllib.parse import quote
from lxml import etree
import sys


def get_jd_data(keyword):
    keyword = quote(keyword)  #解码中文
    url = "https://search.jd.com/Search?keyword={}&enc=utf-8&qrst=1&rt=1&stop=1&vt=2&bs=1&wq={}&stock=1&psort=3&click=0".format(keyword,keyword)
    # print(url)
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:65.0) Gecko/20100101 Firefox/65.0',
        'Cookie':'__jda=122270672.1551510490895255034850.1551510491.1551510491.1551510491.1; __jdb=122270672.12.1551510490895255034850|1.1551510491; __jdc=12227
爬取京东商品销量,可以采用以下步骤: 1. 找到要爬取商品页面,例如:https://item.jd.com/100011017378.html 2. 在浏览器中打开开发者工具,切换到“网络”选项卡,刷新页面,在请求列表中找到“https://c0.3.cn/stock?skuId=100011017378&area=1_2802_2821_0&venderId=1000085383&buyNum=1&choseSuitSkuIds=&cat=1320,1583,1591&extraParam={%22originid%22:%221%22}&ch=1&fqsp=0&pduid=1532361413696148795283&pdpin=&detailedAdd=null&callback=jQuery6761801”这个请求,这个请求返回了商品的库存信息和销量据。 3. 复制这个请求的URL,打开Python,使用requests库发送这个请求,获取返回的JSON据。 4. 解析JSON据,获取销量据。 以下是示例代码: ```python import requests import json url = 'https://c0.3.cn/stock?skuId=100011017378&area=1_2802_2821_0&venderId=1000085383&buyNum=1&choseSuitSkuIds=&cat=1320,1583,1591&extraParam={%22originid%22:%221%22}&ch=1&fqsp=0&pduid=1532361413696148795283&pdpin=&detailedAdd=null&callback=jQuery6761801' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) json_str = response.text.replace('jQuery6761801(', '').replace(');', '') data = json.loads(json_str) sales = data['stock']['saleInfo']['saleCount'] print(sales) ``` 其中,url中的skuId是商品的ID,可以在商品页面URL中找到。area是地区编码,可以在浏览器中找到。venderId是商家ID,可以在商品页面的商家信息中找到。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值