学习笔记(09):Python爬虫开发-总结回顾

最新推荐文章于 2022-05-07 17:03:24 发布

于喝水

最新推荐文章于 2022-05-07 17:03:24 发布

阅读量125

点赞数

分类专栏：研发管理文章标签： python 爬虫编程语言 Python 数据分析

本文链接：https://blog.csdn.net/weixin_45925755/article/details/104252973

版权

研发管理专栏收录该内容

11 篇文章 2 订阅

订阅专栏

立即学习:https://edu.csdn.net/course/play/24454/306768?utm_source=blogtoedu

import requests
import json
if __name__ =="__main__":
    header = {
        "User-Agent": "Mozilla/5.0 (iPad; CPU OS 11_0 like Mac OS X) AppleWebKit/604.1.34 (KHTML, like Gecko) Version/11.0 Mobile/15A5341f Safari/604.1"
    }
    id_list = []  # c存储企业ID
    all_data_list = []  # 存储所有企业详情数据信息
    url="http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsList"
    for page in range(1,6):
        page=str(page)
        data ={
            "on": "true",
            "page": page,
            "pageSize":"15",
            "productName":"",
            "conditionType": "1",
            "applyname":"",

        }
        json_ids =requests.post(url=url,headers=header,data=data).json()

        for dic in json_ids["list"]:
            id_list.append(dic["ID"])
        #获取企业详情数据
        #print(all_data_list)
    post_url ="http://125.35.6.84:81/xk/itownet/portalAction.do?method=getXkzsById"
    for id in id_list:
        data={
           "id":id
        }
        datail_json = requests.post(url=post_url,headers=header,data=data).json()
            #print(datail_json)
        all_data_list.append(datail_json)
        # 持久化存储
    fp=open("./allDate.json","w",encoding="utf-8")
    json.dump(all_data_list,fp=fp,ensure_ascii=False,indent=4)
print("爬虫成功")

于喝水

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习笔记(09):Python爬虫开发-总结回顾

您观看课程学习后免费入群领取【超全Python资料包+17本学习电子书】讲师：波波老师曾就职于百度，任爬虫开发工程师擅长数据分析和爬虫技术，喜欢研究各种爬虫奇淫巧技，专治各种反爬取疑难杂症课程简介： "信息时代，数据为王，互联网包含了迄今为止最有用的数据集，并且大部分...
复制链接

扫一扫

专栏目录