Scrapy爬取淘宝天猫,京东,拼多多等平台商品数据,实时商品详情数据接口

Scrapy爬取淘宝天猫,京东,拼多多等平台商品数据,实时商品详情数据接口

如何运行

  • 1.安装Python3

    具体过程请参考Python官网

  • 2..安装依赖

  • 进入项目目录,执行:

    pip install -r requirements.txt
    
  • 3.配置chromeDriver

    将项目目录下的geckodriver目录加入到PATH中

  • 4.修改数据库配置 在settings.py中

    # 数据库的配置,请将下面的换成你自己的数据库配置
    DB_HOST = 'localhost'  # 主机名
    DB_PORT = 3306  # 端口号
    DB_USER = 'root'    # 用户名
    DB_PASSWD = '123456'  # 密码
    DB_DB = 'juhua'  # 数据库名
    
  • 5.爬取数据:

    scrapy crawl jd
    scrapy crawl taobao
    scrapy crawl product_info

 6. 封装接口代码请求方式:HTTPS   POST  GET  请求URL地址 获取API测试账号

7.公共参数:

名称类型必须描述
keyString调用key(必须以GET方式拼接在URL中)
secretString调用密钥 (复制v:Taobaoapi2014 )
api_nameStringAPI接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cacheString[yes,no]默认yes,将调用缓存的数据,速度比较快
result_typeString[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
langString[cn,en,ru]翻译语言,默认cn简体中文
versionStringAPI版本

8.请求代码示例,支持高并发请求(CURL、PHP 、PHPsdk 、Java 、C# 、Python...)

# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url = "https://api-gw.Taobaoapi2014.cn/jd/item_get/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&num_iid=10335871600"
headers = {
    "Accept-Encoding": "gzip",
    "Connection": "close"
}
if __name__ == "__main__":
    r = requests.get(url, headers=headers)
    json_obj = r.json()
    print(json_obj)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值