Python爬虫简单爬取京东商品属性数据

最新推荐文章于 2024-07-20 09:47:39 发布

崩坏的芝麻

最新推荐文章于 2024-07-20 09:47:39 发布

阅读量2k

点赞数 3

分类专栏： Python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/wangqingbang/article/details/100535391

版权

Python 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

昨天有同学让我帮忙写个简单的爬取京东商品属性的数据，要求很简单，500条商品数据就行。
用的
bs4，和requests，没用框架

import requests
from bs4 import BeautifulSoup
import csv

sku = []
for i in range(1, 10):
    print(i)
    res = requests.get('https://list.jd.com/list.html?cat=9987,653,655&page='+str(i)+'&sort=sort_rank_asc&trans=1&JL=6_0_0&ms=10#J_main')
    html = res.text
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all(class_="gl-item")
    print(i)

    for item in items:
        data = item.find(class_='gl-i-wrap j-sku-item')
        sku.append(data['data-sku'])

length = len(sku)
for i in range(length):
    print(i)
    res = requests.get('https://item.jd.com/'+str(sku[i])+'.html')
    html = res.text
    soup = BeautifulSoup(html, 'html.parser')
    item = soup.find_all(class_="parameter2 p-parameter-list")[0]

    lis = item.find_all('li')

    with open("/Users/liulingzhi/Desktop/recipe.csv", "a") as csv_file:
        writer = csv.writer(csv_file)
        columns = []
        # 先写入columns_name
        for li in lis:
            columns.append(li.text)
        writer.writerow(columns)

最后爬取的结果是：
在这里插入图片描述

崩坏的芝麻

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
5
评论
Python爬虫简单爬取京东商品属性数据

昨天有同学让我帮忙写个简单的爬取京东商品属性的数据，要求很简单，500条商品数据就行。用的bs4，和requests，没用框架import requestsfrom bs4 import BeautifulSoupimport csvsku = []for i in range(1, 10): print(i) res = requests.get('https:/...
复制链接

扫一扫

专栏目录