爬虫笔记:如何遍历json导出到列表中

文章目录

前言

最近在做一个自动化爬取IT桔子投融资到mongodb,然后自动导出我想要的字段到CSV发送邮件到指定邮箱。
其中,如果做到遍历json这点确实难倒了我,找了很多方法,最终实现遍历效果。
原始数据如下

{
    '_id': ObjectId('5cbd1a8513405c7b215db28f'),
    'agg_time': '2019-04-21',
    'city': '深圳',
    'com_des': '金斧子是国内专业的互联网财富管理机构,为新时代的高净值人群提供专业、独立的互联网财富管理服务。金斧子致力于成为新时代高端投资者的百万理财专业平台。一方面,金斧子根据市场动态,不断寻找不同品类、不同策略的私募股权、纯多私募、量化对冲、并购定增、海外基金和固定收益等理财产品满足高净值客户多样化的资产配置需求。另一方面,金斧子追求极致的互联网财富管理服务体验,为客户提供便捷的搜索比价、净值查询、财富记账和线上线下相结合的路演服务。迄今为止,金斧子累计资产管理规模已超300亿,为30万+名新时代的高端投资者提供专业、独立的互联网财富管理服务。',
    'com_id': 3030,
    'com_registered_name': '深圳市金斧子网络科技有限公司',
    'com_scope': '金融',
    'com_sub_scope': '理财',
    'com_tag': [
        {
            'tag_id': 33,
            'tag_name': '金融超市'
        },
        {
            'tag_id': 116,
            'tag_name': '垂直搜索'
        },
        {
            'tag_id': 482,
            'tag_name': '财富管理'
        },
        {
            'tag_id': 609,
            'tag_name': '金融'
        },
        {
            'tag_id': 614,
            'tag_name': '理财'
        },
        {
            'tag_id': 615,
            'tag_name': '基金'
        },
        {
            'tag_id': 3453,
            'tag_name': '资产管理'
        },
        {
            'tag_id': 3572,
            'tag_name': '理财平台'
        },
        {
            'tag_id': 3753,
            'tag_name': '量化交易'
        },
        {
            'tag_id': 4005,
            'tag_name': '海外投资'
        },
        {
            'tag_id': 5000,
            'tag_name': '连续获投'
        },
        {
            'tag_id': 6927,
            'tag_name': '金融机构'
        },
        {
            'tag_id': 6928,
            'tag_name': '投资理财'
        },
        {
            'tag_id': 6930,
            'tag_name': '综合金融服务'
        },
        {
            'tag_id': 6944,
            'tag_name': '高净值'
        }
    ],
    'currency': '人民币',
    'day': 21,
    'id': 10403165,
    'investor': [
        {
            'type_id': 2,
            'name': '正心谷创新资本(领投)',
            'id': 3213,
            'url': 'https: //www.itjuzi.com/investfirm/3213',
            'type': '领投'
        },
        {
            'type_id': 2,
            'name': '启诚资本',
            'id': 6869,
            'url': 'https: //www.itjuzi.com/investfirm/6869',
            'type': '跟投'
        }
    ],
    'invse_des': '金斧子是意见互联网财富管理机构,为新时代的高净值人群提供专业、独立的互联网财富管理服务。近日,在第三届私募大会上,金斧子宣布获得1.72亿的Pre-D轮融资,由正心谷创新资本领投,
    启诚资本跟投。',
    'invse_title': '金斧子获得1.72亿人民币D轮融资,正心谷创新资本领投,启诚资本参投',
    'location': 'in',
    'logo': 'https: //cdn.itjuzi.com/images/c3aa63802178dfd19af780cf653dbff5.png?imageView2/0/q/100',
    'maxima': False,
    'money': '1.72亿人民币',
    'money_num': 17200,
    'month': 4,
    'name': '金斧子',
    'nicorn': False,
    'one_year': True,
    'prov': '广东',
    'round': 'D轮',
    'slogan': '国内专业的互联网财富管理机构',
    'term_tag': [
        {
            'tag_id': 33,
            'tag_name': '金融超市'
        },
        {
            'tag_id': 116,
            'tag_name': '垂直搜索'
        },
        {
            'tag_id': 482,
            'tag_name': '财富管理'
        },
        {
            'tag_id': 609,
            'tag_name': '金融'
        },
        {
            'tag_id': 614,
            'tag_name': '理财'
        },
        {
            'tag_id': 615,
            'tag_name': '基金'
        },
        {
            'tag_id': 3453,
            'tag_name': '资产管理'
        },
        {
            'tag_id': 3572,
            'tag_name': '理财平台'
        },
        {
            'tag_id': 3753,
            'tag_name': '量化交易'
        },
        {
            'tag_id': 4005,
            'tag_name': '海外投资'
        },
        {
            'tag_id': 5000,
            'tag_name': '连续获投'
        },
        {
            'tag_id': 6927,
            'tag_name': '金融机构'
        },
        {
            'tag_id': 6928,
            'tag_name': '投资理财'
        },
        {
            'tag_id': 6930,
            'tag_name': '综合金融服务'
        },
        {
            'tag_id': 6944,
            'tag_name': '高净值'
        }
    ],
    'time': 1555776000,
    'two_year': False,
    'valuation': 86000,
    'well_known_enterprises': True,
    'well_known_fa': False,
    'well_known_wind_cast': True,
    'year': 2019
}

实现

这里我要导出的是investor中的name字段,这个name字段可能有1个,可能有两个。

 company = [company.get('name') for company in row['investor']]

效果

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值