数据采集-京东子店铺类目数据

利用攻克进行京东类目采集目前是有两种方式可以实现:

一、自己利用selenium或者影刀点击切换店铺,然后通过攻克配置直接保存数据到数据库

下载地址:https://www.yuque.com/gk.ai/gkdata/zn5r4grngkk2lidp
推荐:GKA496F78CB479347D4F5B3E05892795A5

 二、第二种是利用攻克先全部店铺登录一遍拿到cookie

然后利用攻克生成的python代码再循环遍历cookie就可以形成一套完整的京东类目数据采集啦

生成的python是下面这样的:

import sys
sys.path.append( r'D:\Tools\GKData\ApiConfig')
import Gk
Gk.Guid2DB_Path = r'"D:\Tools\GKData\3rdLibs\Guid2DB.exe" ' 

def 从数据库账号批量下载实例():
  import pymssql
  db = pymssql.connect(连接信息,charset='utf8')
  cursor = db.cursor()
  cursor.execute("SELECT [平台店铺ID],[请求头],[Cookie] FROM [账号信息] where 平台='京东' and 状态='RUN' order by 1 desc")
  result_login = cursor.fetchall()
  # print(result_login)
  db.commit()
  cursor.close( )
  db.close()

  for rec in result_login:
    cookie=rec[2]

    # 根据实际代码替换下面代码:
    _headers_dict =  {
      "Host": "sz.jd.com",
      "Connection": "keep-alive",
      "Cookie": f"{cookie}",
    }
    # 自动生成的代码,设置的新值会当作变量传入url
    _url = f'https://sz.jd.com/sz/api/realtime/getRealtimeData.ajax?'#.format()
    _post_data_string = ''''''
    response = Gk.get_request(_url, _headers_dict,True) 
    print(response)
    #Gk.Guid2DB( _url, _headers_dict, _post_data_string, response)

#从数据库账号批量下载实例()

# 实际代码:
_headers_dict =  {
  "Host": "sz.jd.com",
  "Connection": "keep-alive",
  "sec-ch-ua": "\"Not.A/Brand\";v=\"8\", \"Chromium\";v=\"114\", \"Google Chrome\";v=\"114\"",
  "sec-ch-ua-mobile": "?0",
  "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36",
  "Accept": "application/json, text/plain, */*",
  "User-mup": "1689572845832",
  "p-pin": "%E7%8C%AB%E4%BA%BA%E9%92%88%E7%BA%BA-%E5%85%B3",
  "uuid": "84e6f8ada79706ac744f-1896263a908",
  "X-Requested-With": "XMLHttpRequest",
  "User-mnp": "95d5423e4ed45e52e84701e0d15ae9e3",
  "sec-ch-ua-platform": "\"Windows\"",
  "Sec-Fetch-Site": "same-origin",
  "Sec-Fetch-Mode": "cors",
  "Sec-Fetch-Dest": "empty",
  "Referer": "https://sz.jd.com/sz/view/dealAnalysis/dealFeatures.html",
  "Accept-Encoding": "gzip, deflate",
  "Accept-Language": "zh-CN,zh;q=0.9",
  "Cookie": "__jdu=1677815960962839351025; shshshfpa=84c470ea-cff6-210a-eff2-eddfcca5378b-1678864499; shshshfpx=84c470ea-cff6-210a-eff2-eddfcca5378b-1678864499; shshshfpb=pGTg8S96J3RZFlKtDAOleTQ; close_2021_datuanyuan=true; shshshfp=753d08fe4cee56f22e819f80a5297de6; unpl=JF8EALJnNSttW01WBE4LTxEWT15RWwgITB5QbmYDAQ9QTVBSE1JIGhV7XlVdXxRKER9uYhRUWVNKVg4eASsSEXteU11bD00VB2xXVgQFDQ8WUUtBSUt-SVxRWFULSBMCa2IFZG1bS2QFGjIbFRZNVFRaVQ9KHwRsbgdcX1xLVQYfMhoiF3ttZFxbC0IeAV9mNVVtGh8IAxIFGRAYBl1TWFsBSxMLaGYNU15RSVwHHwIaERR7XGRd; __jdv=76161171|baidu-search|t_262767352_baidusearch|cpc|304792250541_0_2730d8e275244d168b007dc975f9ab94|1688454222885; ipLoc-djd=17-1381-50712-62966; is_sz_old_version=false; user-key=059944c8-5b2e-4668-9d75-6a43caf8bf29; 3AB9D23F7A4B3CSS=jdd037FBOII2QKMVBJK6SEC5YPMDDI6YD5FSKEGFXTAH5Q7GJ4XCJTNPL2EDDAI3MQI5UUXHZFCT3PANI6B4WO5DN4ID65QAAAAMJETFX6MYAAAAACWIF5EBHCF4FFQX; language=zh_CN; ceshi3.com=000; __USE_NEW_PAGEFRAME__=false; _base_=YKH2KDFHMOZBLCUV7NSRBWQUJPBI7JIMU5R3EFJ5UDHJ5LCU7R2NILKK5UJ6GLA2RGYT464UKXAI5TPYU4VBBBWDQX6FGO2MU2LUEV2XDQDZRBVN7OKRFLKSE3FV4JUXTCNE6YVKRXISU2WLRJ47JBGDYZZELA6E4S4L2GMCISTNJJIUDMCG2YNJHAVPRUPVR23HV67S3YPT3KUNF2XFZ2E7RKLOUMQ6VUD7HOSCSD56FZKSWZVDQINZB6KKEX4USCF555UOYV4EANFJJLUDQ7C6XWUVH46IGQS4XX2SG4SOQWCP5WPWO6EFS7HEHMRWVKBRVHB33TFD4GOCM2TYVW62O5LYZS4KXUMIMAHEAS5O2NKTSSRQQ22TIFETF5Z3K5SQN5KHNQWZL3ZGF7H6XBEC7Q73BWLIMPYNOLKTKDBDWMHUKJQF4ZFOTNBBYBIZRXZYERXXIG6ASUCQBMVM4HS7LSXEXQ5243S2A6DM4H2Y4MU46JFLRTC4IR7L7KZPAQQQKEP2DVC3FRYW46NESWDFYQ; 3AB9D23F7A4B3C9B=7FBOII2QKMVBJK6SEC5YPMDDI6YD5FSKEGFXTAH5Q7GJ4XCJTNPL2EDDAI3MQI5UUXHZFCT3PANI6B4WO5DN4ID65Q; wlfstk_smdl=xg2q7y91uxstwp64sn5tx5y7q0x1uxbr; TrackID=1U-ntEgeiDPOb41NtpY-cU96XGYnJRqYJX9h7_nVDr4V1LLNKrlTCjPQa7uIo5z3nQRRheMv7mtMgbinoZXE_YnUAIJfhtUa-V3QWJVcaUGQ; thor=AC09D8FDB30392FA865E6CFD5D3266A2C84E7F880265F87DB8B93AC0D2E235727F1B4CF99CD68D9A0B288CF0A902AF537AFFB154805A76C36D7AEDC3ABAF559149F411760E9891389A2D1AD9DFCE34585D2908E301515F0E395AD23AC32270D9F0658DBFD8ABBB16FB24F5BB1CDF921C44429E9C7067832568F4926949DD4884; flash=2_VQXRRX-sMATCwFpHDiPEGl3SDbxAFKgllVMgqviWCUUI6t4liDBuBgYa8TzoZJVBP4MuofDeeL28plXx0WqZ_xUAVnKkqATPnGv8WggCLmP*; pinId=vOuujp2GM_HPXPHJr9XWTbV9-x-f3wj7; pin=%E7%8C%AB%E4%BA%BA%E9%92%88%E7%BA%BA-%E5%85%B3; unick=%E7%8C%AB%E4%BA%BA%E9%92%88%E7%BA%BA-%E5%85%B3; _tp=9hek%2BXTf8ylULoFOWfDPkk42THGVHy%2B5BXj2LBy9p0UMtDwuEHXu4jObkMsJl%2F%2Fq; _pst=%E7%8C%AB%E4%BA%BA%E9%92%88%E7%BA%BA-%E5%85%B3; b-sec=RMBIUHLOT4656L65AOYFDSLB47B34Y73NCLRJM6JOLYJDMCSFHLOMYAASYIPO7BXQWPT73RMQO37K; __jda=251704139.1677815960962839351025.1677815960.1689565995.1689572723.149; __jdc=251704139; __jdb=251704139.6.1677815960962839351025|149.1689572723"
}



# 自动生成的代码,设置的新值会当作变量传入url
_url = f'https://sz.jd.com/sz/api/trade/getCategoryFeatureData.ajax?channel=99&date=2023-07-16&endDate=2023-07-16&startDate=2023-07-16'#.format()
_post_data_string = ''''''
response = Gk.get_request(_url, _headers_dict,True) 
print(response)
Gk.Guid2DB( _url, _headers_dict, _post_data_string, response)

 然后需要自己加工一下日期之类的就可以了,如果不考虑日期这个代码就可以直接运行啦。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 淘宝商品的大类 id 类数据是指在淘宝平台上各个商品类别的分类信息。淘宝平台上的商品类别非常广泛,涵盖了服装、家居、数码、美妆、食品、母婴等各个领域。 淘宝商品的大类 id 类数据一般由淘宝平台自行维护,并以数字化的形式进行标识和管理。每个大类 id 都对应着一个具体的商品类,例如服装类别的大类 id 可能为1,电器类别的大类 id 可能为2。 在每个大类 id 下,又会细分出多个小类,如服装类别下可能包括男装、女装、童装等多个小类别的商品。这样的分类体系能够帮助消费者更快速、准确地找到他们所需要的商品。 淘宝平台上的商品数据非常庞大,因此对于每个商品,都会有一个唯一的类标识,以区分所属的具体类别。这样的类数据可以用于搜索商品、展示商品、推荐商品等多个方面的应用。 淘宝商品的大类 id 类数据对于商家来说也非常重要,商家需要根据具体的商品属性选择合适的类进行上架销售。同时,这些类数据也能够帮助商家更好地了解市场行情和竞争对手情况,为商家的运营决策提供参考。 ### 回答2: 淘宝商品的大类id类数据是指淘宝平台上各个商品大类的标识和对应的类数据。淘宝平台上的商品种类繁多,为了方便用户浏览和搜索,淘宝将商品按照不同的大类进行分类管理,并为每个大类分配一个唯一的标识符,即大类id。 淘宝的商品大类包括服饰、手机数码、家电、美妆、母婴、食品、家居、运动户外、汽车、图书、虚拟商品等。 大类id类数据是指每个商品大类对应的具体类数据集合。具体来说,每个大类都会有一系列的细分类,用于更精确地描述和归类商品。例如,服饰大类下的类可以包括男装、女装、童装等;手机数码大类下的类可以包括手机、电脑、相机等。 每个类都有自己的类id和类名称,类id是该类在淘宝平台上的唯一标识符,可以用于区分不同类。类名称则是对该类的简要描述,方便用户快速识别。 淘宝商品大类id类数据的存在,使得用户能够更便捷地找到自己所需的商品。无论是在浏览页面还是进行搜索,用户可以根据自己的需求选择相应的大类和类,从而缩小商品范围,提高购物效率。同时,对于卖家来说,也能更好地将自己的商品归类到相应的大类和类下,增加曝光和销量机会。 ### 回答3: 淘宝商品大类id类数据是指淘宝网站上各个商品分类的唯一标识和类名称的数据。淘宝网站作为国内最大的电商平台之一,商品分类繁多,以满足不同消费者的需求。 淘宝商品大类id是淘宝系统对每个商品分类设置的唯一标识,通过这个标识可以在后台数据库中快速找到对应的类数据。每个大类id对应一个具体的商品类,如服饰类、家居类、食品类等。 类数据是指每个商品类的具体信息,包括类名称、类级别、类图标等。每个类都有一个唯一的类名称,用于在网站上显示给用户,方便用户浏览和搜索。类级别表示该类在淘宝商品分类中的层级位置,一级类为最高级别,二级类为一级类,以此类推。类图标是类的标识符,用于在网站上展示给用户,方便用户识别和选择。 淘宝商品大类id类数据的存在,方便用户在淘宝网站上浏览和搜索自己感兴趣的商品。用户可以通过浏览大类id类数据,快速找到自己所需要的商品类别,并进一步浏览该类下的各个和具体商品。类数据的合理设置和分类,可以提升用户的购物体验,提高淘宝网站的整体运营效率。同时,对于淘宝卖家来说,淘宝商品大类id类数据的准确和完善,也是他们进行商品发布和销售的重要依据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值