python数据处理/包含字典的数组

本文介绍了在处理从Mongo数据库中提取的包含字典的数组数据时所遇到的问题及解决方案。使用Mongo的aggregate方法进行数据筛选,并通过pipeline操作获取特定字段。在进一步处理中,利用$artists.id获取字典内值,并注意数据类型可能为数组。在将数据导入pandas时,使用`pd.DataFrame.from_dict()`函数,通过orient参数设置将字典转换为DataFrame。
摘要由CSDN通过智能技术生成

从mongo提取数据的时候,遇到了一类让人有点头疼的数据,数据类型是一个数组,数组内包含的是字典,大致如下:

在处理的过程中想了半天办法,也学了不少东西:先说说怎么处理这类数据,再来说我中间用到的几种新的方法,虽然没有起到特别大的作用,但是学到了不少新东西。

解决办法算是用了比较暴力的方法:

使用mongo的aggregate方法筛选数据,这里的col是我已经创建好了的一个指定mongo的表

pipline = [
    {'$match': {"$and": [{"crawl_time": {"$gte": "2020-07-23 0:0:0"}}, {"crawl_time": {"$lt": "2020-08-03 0:0:0"}}]
                }}, {'$project': {'songId': 1, 'playCount': 1, 'crawl_time': 1, 'songName': 1, 'albums': 1,'artists':1}}]
mongo_r = col.aggregate(pipline)
songId = []
playCount = []
crawl_time = []
songName = []
albums_name = []
albums_id = []
artists_name=[]

for i 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值