从mongo提取数据的时候,遇到了一类让人有点头疼的数据,数据类型是一个数组,数组内包含的是字典,大致如下:
在处理的过程中想了半天办法,也学了不少东西:先说说怎么处理这类数据,再来说我中间用到的几种新的方法,虽然没有起到特别大的作用,但是学到了不少新东西。
解决办法算是用了比较暴力的方法:
使用mongo的aggregate方法筛选数据,这里的col是我已经创建好了的一个指定mongo的表
pipline = [ {'$match': {"$and": [{"crawl_time": {"$gte": "2020-07-23 0:0:0"}}, {"crawl_time": {"$lt": "2020-08-03 0:0:0"}}] }}, {'$project': {'songId': 1, 'playCount': 1, 'crawl_time': 1, 'songName': 1, 'albums': 1,'artists':1}}] mongo_r = col.aggregate(pipline) songId = [] playCount = [] crawl_time = [] songName = [] albums_name = [] albums_id = [] artists_name=[] for i