学习笔记(01):Python爬虫开发-总结回顾

立即学习:https://edu.csdn.net/course/play/24454/306768?utm_source=blogtoedu

import requests
import  json
if __name__ == "__main__":
    #第一步获取全部ID
    url='http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList'
    headers={
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
    }
    post_url = 'http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsById'
    dic_list = [];
    ID_list = []  # 存储id
    for page in range(1,10):
        page=str(page)
        data={
            'on': 'true',
            'page':page,
            'pageSize': '15',
            'productName':'',
            'conditionType':'1',
            'applyname':'',
            'applysn':'',
        }
        json_ids=requests.post(url=url,data=data,headers=headers).json()

        for dic in json_ids['list']:
          ID_list.append(dic['ID'])
    #第二部:获取详情页数据

    for id in ID_list:
        data={
            'id':id
        }
        page_post=requests.post(url=post_url,data=data,headers=headers).json()
        dic_list.append('公司名称:'+page_post['epsName']+' 企业负责人:' + page_post['legalPerson']+' 许可证编号:' + page_post['productSn'])

    fp=open('./化妆品详细数据.json','w',encoding='utf-8')
    json.dump(dic_list,fp=fp,ensure_ascii=False)
    print('over!!!')


  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值