python爬虫（二）

TROWS

于 2021-01-31 00:44:13 发布

阅读量112

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/nglhaeg/article/details/113449383

版权

Python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

该Python脚本使用requests库进行POST请求，从指定URL抓取住户信息。数据以JSON格式返回，包括住户ID、姓名、身份证、电话等字段。解析后的数据存储到一个列表中，并利用xlwt库将数据写入Excel文件，便于后续分析和处理。

摘要由CSDN通过智能技术生成

post请求，解析的数据格式如：

{"code":0,"msg":"","count":20409,"data":[{"name":"张三"},{"SEX":"男"},{"age":"20"}]}

具体代码

# -*- coding = utf-8 -*-
# @Time: 2021/1/30
# @File: spiderOwner.py
# @Software: PyCharm

import requests
import json
import xlwt


def main():
    baseurl = "http://www.behomesc.com/owner/listData"
    datalist = []
    for i in range(0,99):
        print("第%d页" % (i + 1))
        # 1.爬取网页
        result = requests.post(baseurl, data={"limit": 10, "page": i+1},
                               cookies={"custom.name": "65235d4a-c208-4364-82ed-505c61df22af"})
        # print(result.text)
        # 2.解析数据
        dictR = json.loads(result.text)     # 转换成字典dict
        datas = dictR.get("data")
        for item in datas:
            data = []
            data.append(item.get("toId"))  # 住户ID
            data.append(item.get("toName"))  # 住户名字
            data.append(item.get("toCardNum"))  # 身份证
            data.append(item.get("toPhone"))  # 电话
            data.append(item.get("toBirthday"))  # 生日
            data.append(item.get("toEthnic"))  # 民族
            data.append(item.get("toPhoto"))  # 照片
            datalist.append(data)
    # print(datalist)
    # 3.保存数据
    book = xlwt.Workbook(encoding="utf-8", style_compression=0)
    sheet = book.add_sheet("住户信息", cell_overwrite_ok=True)
    col = ('住户ID', "住户名字", "身份证", "电话", "生日", "民族", "照片")
    print("开始保存。。。")
    for i in range(0, 7):
        sheet.write(0, i, col[i])
    for i in range(0, len(datalist)-1):
        print("第%d条" % (i + 1))
        data = datalist[i]
        for j in range(0, 7):
            sheet.write(i + 1, j, data[j])
    book.save("住户信息.xls")
    print("爬取完毕。。。")


if __name__ == "__main__":
    main()

TROWS

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫（二）

post请求，解析的数据格式如：{"code":0,"msg":"","count":20409,"data":[{"name":"张三"},{"SEX":"男"},{"age":"20"}]}具体代码# -*- coding = utf-8 -*-# @Time: 2021/1/30# @Author: 杨东# @File: spiderOwner.py# @Software: PyCharmimport requestsimport jsonimport xlwtdef m
复制链接

扫一扫

专栏目录