python爬虫(二)

该Python脚本使用requests库进行POST请求,从指定URL抓取住户信息。数据以JSON格式返回,包括住户ID、姓名、身份证、电话等字段。解析后的数据存储到一个列表中,并利用xlwt库将数据写入Excel文件,便于后续分析和处理。
摘要由CSDN通过智能技术生成

post请求,解析的数据格式如:

{"code":0,"msg":"","count":20409,"data":[{"name":"张三"},{"SEX":"男"},{"age":"20"}]}

具体代码

# -*- coding = utf-8 -*-
# @Time: 2021/1/30
# @File: spiderOwner.py
# @Software: PyCharm

import requests
import json
import xlwt


def main():
    baseurl = "http://www.behomesc.com/owner/listData"
    datalist = []
    for i in range(0,99):
        print("第%d页" % (i + 1))
        # 1.爬取网页
        result = requests.post(baseurl, data={"limit": 10, "page": i+1},
                               cookies={"custom.name": "65235d4a-c208-4364-82ed-505c61df22af"})
        # print(result.text)
        # 2.解析数据
        dictR = json.loads(result.text)     # 转换成字典dict
        datas = dictR.get("data")
        for item in datas:
            data = []
            data.append(item.get("toId"))  # 住户ID
            data.append(item.get("toName"))  # 住户名字
            data.append(item.get("toCardNum"))  # 身份证
            data.append(item.get("toPhone"))  # 电话
            data.append(item.get("toBirthday"))  # 生日
            data.append(item.get("toEthnic"))  # 民族
            data.append(item.get("toPhoto"))  # 照片
            datalist.append(data)
    # print(datalist)
    # 3.保存数据
    book = xlwt.Workbook(encoding="utf-8", style_compression=0)
    sheet = book.add_sheet("住户信息", cell_overwrite_ok=True)
    col = ('住户ID', "住户名字", "身份证", "电话", "生日", "民族", "照片")
    print("开始保存。。。")
    for i in range(0, 7):
        sheet.write(0, i, col[i])
    for i in range(0, len(datalist)-1):
        print("第%d条" % (i + 1))
        data = datalist[i]
        for j in range(0, 7):
            sheet.write(i + 1, j, data[j])
    book.save("住户信息.xls")
    print("爬取完毕。。。")


if __name__ == "__main__":
    main()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值