场景描述
笔者对采集的数据进行处理的时候发现,采集到的json数据是多层级的,而转为DataFrame后是二维表,因此部分字段需要进行拆分。通过打印类型可知,该数据为字典格式。
解决办法
使用apply()函数对该列数据批量进行处理,字典可以通过key来索引取值。
df['cost'] = df['biz_ext'].apply(lambda x: x['cost']) # biz_ext是字典所在列的字段名
如果存在不是字典的记录,则需要判断。如果需要额外的处理,可以定义更复杂的函数
df['cost'] = df['biz_ext'].apply(lambda x: x['cost'] if type(x) is dict else None)