pandas拆分嵌套列表

最新推荐文章于 2024-07-06 23:56:06 发布

改一个酷酷的用户名

最新推荐文章于 2024-07-06 23:56:06 发布

阅读量216

点赞数

文章标签： pandas

本文链接：https://blog.csdn.net/qq_24254257/article/details/133020755

版权

文章讲述了如何使用pandas库处理DataFrame，将嵌套的Mean_Features列表拆分为单独列。通过遍历DataFrame，利用pd.DataFrame()和pd.concat()函数展开并拼接数据，最终得到769列的新DataFrame。

摘要由CSDN通过智能技术生成

项目场景：处理数据时遇到个需要把DataFrame中嵌套列表元素拆分的工作

问题描述

我有一个这样的DataFrame
在这里插入图片描述

就意思是想把它每一个县对应的Mean_Features（一个嵌套的列表），拆分成许多列

`每一列就是列表中的一个元素`

解决方案：

遍历读取每行的Mean_Features列，通过pd.DataFrames()直接将list展开，然后再和county列进行拼接

因为对于类似这样的数据A=[1, 2, 3, 4]或A=[[1], [2], [3], [4]]的列表，经过pd.DataFrame()可以直接变成下图这样的DataFrame

data1 = [1, 2, 3, 4]
data2 = [[1], [2], [3], [4]]
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

在这里插入图片描述
所以每一行的操作就可以通过下面这行代码实现

data = pd.concat([pd.DataFrame([row["County"]], columns=["county"]), pd.DataFrame(row["Mean_Features"]).T], axis=1)
# 由于pd.DataFrame(row["Mean_Features"])直接生成的是一列，所以将其进行转置

就能得到一个1×769的dataframe

完整代码

# 创建一个包含769列的空DataFrame
num_columns = 768
column_names = ['county']
df_final = pd.DataFrame(columns=column_names)
for index, row in df_new.iterrows():
    data = pd.concat([pd.DataFrame([row["County"]], columns=["county"]), pd.DataFrame(row["Mean_Features"]).T], axis=1)
    # print(data)
    # 使用 concat 函数纵向连接两个DataFrame
    df_final = pd.concat([df_final, data], axis=0, ignore_index=False)
# df_final

在这里插入图片描述

Finish!

改一个酷酷的用户名

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas拆分嵌套列表

因为对于类似这样的数据A=[1, 2, 3, 4]或A=[[1], [2], [3], [4]]的列表，经过。直接将list展开，然后再和county列进行拼接。所以每一行的操作就可以通过下面这行代码实现。就能得到一个1×769的dataframe。可以直接变成下图这样的DataFrame。
复制链接

扫一扫