DataFrame 同时包含字典和字典列表的列拆分为字典列

最新推荐文章于 2023-12-22 10:30:16 发布

这个人懒得名字都没写

最新推荐文章于 2023-12-22 10:30:16 发布

阅读量2.7w

点赞数 6

分类专栏： Python 文章标签： python 数据分析

本文链接：https://blog.csdn.net/weixin_42856871/article/details/109839766

版权

Python 专栏收录该内容

40 篇文章 10 订阅

订阅专栏

DataFrame 同时包含字典和字典列表的列拆分为字典列

一个DataFrame中，一个同时包含字典和字典列表的列，想要把字典列表中的字典单独形成一行。

示例：

import numpy
import pandas

df = pandas.DataFrame(
    numpy.array(
        [
            ['a', 'b', {'name': 'apple', 'price': 10}], 
            ['a', 'b', [{'name': 'banana', 'price': 20}, {'name': 'peach', 'price': 30}]], 
            ['a', 'b', [{'name': 'pear', 'price': 30}]]
        ], dtype=object
    ), 
    columns=['A', 'B', 'Fruit']
)

df

	A	B	Fruit
0	a	b	{‘name’: ‘apple’, ‘price’: 10}
1	a	b	[{‘name’: ‘banana’, ‘price’: 20}, {‘name’: 'pe…
2	a	b	[{‘name’: ‘pear’, ‘price’: 30}]

先定义一个函数，将字典外层添加一层列表将Fruit列统一为字典列表。

def into_list(x):
    """
    字典外层添加一层列表

    :param x: 字典
    :return: 字典列表
    """

    a_list = list()
    a_list.append(x)

    return a_list

A列

# 取出A与Fruit列
a_df = pandas.DataFrame(df, columns=['A', 'Fruit'])

# 将字典外层添加一层列表 将Fruit列统一为字典列表
a_df.loc[:, 'Fruit'] = a_df.loc[:, 'Fruit'].apply(
    lambda x: into_list(x) if type(x) == dict else x
)

# 将列表里面的每一个字典拆分为一行
a_df_new_values = numpy.dstack(
    (numpy.repeat(a_df.loc[:, 'A'].values, list(map(len, a_df.Fruit.values))),
     numpy.concatenate(a_df.Fruit.values))
)

a_df = pandas.DataFrame(data=a_df_new_values[0], columns=a_df.columns)

a_df

	A	Fruit
0	a	{‘name’: ‘apple’, ‘price’: 10}
1	a	{‘name’: ‘banana’, ‘price’: 20}
2	a	{‘name’: ‘peach’, ‘price’: 30}
3	a	{‘name’: ‘pear’, ‘price’: 30}

B列

# 取出B与Fruit列
b_df = pandas.DataFrame(df, columns=['B', 'Fruit'])

# 将字典外层添加一层列表 将Fruit列统一为字典列表
b_df.loc[:, 'Fruit'] = b_df.loc[:, 'Fruit'].apply(
    lambda x: into_list(x) if type(x) == dict else x
)

# 将列表里面的每一个字典拆分为一行
b_df_new_values = numpy.dstack(
    (numpy.repeat(b_df.loc[:, 'B'].values, list(map(len, b_df.Fruit.values))),
     numpy.concatenate(b_df.Fruit.values))
)

b_df = pandas.DataFrame(data=b_df_new_values[0], columns=b_df.columns)

b_df

	B	Fruit
0	b	{‘name’: ‘apple’, ‘price’: 10}
1	b	{‘name’: ‘banana’, ‘price’: 20}
2	b	{‘name’: ‘peach’, ‘price’: 30}
3	b	{‘name’: ‘pear’, ‘price’: 30}

将A与B合并

在合并A与B之前,它们有相同列Fruit，需要将它们其中一个的Fruit列删除。

b_df.drop(columns='Fruit', inplace=True)

合并

df = a_df.join(b_df)

df

	A	Fruit	B
0	a	{‘name’: ‘apple’, ‘price’: 10}	b
1	a	{‘name’: ‘banana’, ‘price’: 20}	b
2	a	{‘name’: ‘peach’, ‘price’: 30}	b
3	a	{‘name’: ‘pear’, ‘price’: 30}	b

这个人懒得名字都没写

关注

6
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
DataFrame 同时包含字典和字典列表的列拆分为字典列

DataFrame 同时包含字典和字典列表的列拆分为字典列一个DataFrame中，一个同时包含字典和字典列表的列，想要把字典列表中的字典单独形成一行。示例：import numpyimport pandasdf = pandas.DataFrame( numpy.array( [ ['a', 'b', {'name': 'apple', 'price': 10}], ['a', 'b', [{'name': 'ba
复制链接

扫一扫