通过API来批量抓取阿里八八商品分类,公司档案信息数据

以下是使用 Python 通过 API 批量抓取 商品分类和公司档案信息数据的一般步骤:

公共参数

封装好的请求URL地址获取API测试账号。

名称类型必须描述
keyString调用key(必须以GET方式拼接在URL中)
secretString调用密钥
api_nameStringAPI接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cacheString[yes,no]默认yes,将调用缓存的数据,速度比较快
result_typeString[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
langString[cn,en,ru]翻译语言,默认cn简体中文
versionStringAPI版本

此API目前支持以下基本接口:

响应参数

Version: Date:

名称类型必须示例值描述

num_iid

Bigint060840463360商品ID

title

String0穿上灰色男士日常都市步行鞋商品标题

desc_short

String0商品简介

price

String047.70价格

nick

String0cn1522808546pkux掌柜昵称

num

String0999

min_num

String02

detail_url

String0https://www.alibaba.com/product-detail/Reebaby-Hot-Sell-Group-0-with_60840463360.html商品链接

pic_url

String0//sc01.alicdn.com/kf/HTB1GHVXaPvuK1Rjy0Faq6x2aVXa7.jpg商品图片

desc

String0

item_imgs

Mix0[{"url": "//sc02.alicdn.com/kf/HTB1ta_basfrK1RjSszcq6xGGFXaA/China-Factory-Outdoor-Driving-Casual-Shoes-Men.jpg"}]商品图片列表

props_name

String0"191288010:-1:颜色:海军;191288010:3331185:颜色:白色;商品属性名

prop_imgs

Mix0{"prop_img": ["properties": "191288010:3851110","url": "//sc01.alicdn.com/kf/HTB1CnsUasfrK1Rjy1Xdq6yemFXag.jpg_250x250.jpg"]}商品属性图片列表

props

Mix0{"name": "产地","value": "中国"}属性

skus

Mix0{sku [[]]}商品规格信息列表

priceRange

Mix0[2,47.7]价格区间

props_list

Mix0["191288010:-1": "颜色:海军"]商品属性列表

seller_info

Mix0{"nick": "cn1522808546pkux", "title": "Guangzhou Gull Road Trade Co., Ltd.", "zhuy": "https://hotpotato.en.alibaba.com/", "shop_name": "Guangzhou Gull Road Trade Co., Ltd." }卖家信息

error

String0错误信息

props_img

Mix0["191288010:3851110": "//sc01.alicdn.com/kf/HTB1CnsUasfrK1Rjy1Xdq6yemFXag.jpg_250x250.jpg"]

currency_code

String0USD

language_code

String0en

property_alias

String0商品属性别名

sales

String0销量

desc_img

Mix0["//u.alicdn.com/js/5v/esite/img/img-placeholder.png"]详情图片

shop_item

Mix0[]

relate_items

Mix0[]

抓取公司档案信息数据

抓取公司档案信息数据的步骤与抓取商品分类类似,但具体的 API 接口和参数可能不同:

  1. 申请 API 权限并获取密钥:同商品分类的步骤 1。
  2. 查看 API 文档:了解获取公司档案信息数据的 API 接口、所需参数以及返回值的格式与内容。
  3. 构建请求
    • 确定请求 URL 和必要的参数,如公司 ID 等。
    • 根据 API 要求设置其他可能的参数,如appkeytimestamp(时间戳)等,并进行相应的签名计算(如果 API 要求)。签名计算通常涉及将参数按照一定规则排序、拼接,然后使用密钥进行加密等操作,具体计算方法需参考 API 文档。
  4. 发送请求:使用requests库发送经过签名处理后的请求。
  5. 处理响应
    • 获取响应数据并解析 JSON。
    • 从 JSON 中提取公司档案的相关信息,如公司名称、注册地址、联系方式等。
    • 将数据存储到合适的存储介质中。

以下是一个简单的示例代码框架(假设已经实现了签名计算函数calculate_signature):

import requests

appkey = "your_appkey"
secretkey = "your_secretkey"
company_id = "target_company_id" 

# 构建请求 URL
url = f"https://api.1688.com/xxx/company_info_get?appkey={appkey}" 

# 设置请求参数,包括公司 ID 和签名等
params = {
    "company_id": company_id,
    "timestamp": "current_timestamp",  # 替换为实际的当前时间戳
    "sign": calculate_signature(params, secretkey)  # 计算签名
} 

# 发送请求
response = requests.get(url, params=params)

# 处理响应
if response.status_code == 200:
    data = response.json()
    # 解析 JSON 数据并提取公司档案信息
    company_name = data["company_name"]
    print(f"公司名称: {company_name}")
else:
    print(f"请求失败,状态码: {response.status_code}")

请注意:

  • 实际的 API 接口地址、参数和返回值可能会因 平台的更新而有所变化,所以在开发过程中一定要参考最新的 API 文档。
  • 遵守 平台的使用规则和限制,避免因违规操作导致账号被封禁等问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值