如何暴力转置dict类型的DataFrame结构数据？

最新推荐文章于 2024-09-27 10:11:28 发布

AppleYRY

最新推荐文章于 2024-09-27 10:11:28 发布

阅读量196

点赞数

分类专栏： # 数据分析和数据挖掘文章标签： python

本文链接：https://blog.csdn.net/weixin_42676175/article/details/120269416

版权

数据分析和数据挖掘专栏收录该内容

9 篇文章 1 订阅

订阅专栏

该博客介绍了如何在Python中处理字典类型数据，特别是当键Key过多时，如何通过转置优化数据保存。使用pandas的DataFrame，分别展示了如何仅对values转置和对整个键值对转置的方法，从而达到理想的数据保存格式。示例代码中展示了从csv文件读取数据，处理并转置后保存为新的DataFrame。

摘要由CSDN通过智能技术生成

继上次数据分析代码

由于dict类型的键Key太多，保存数据时，效果并不理想。
新需求：在已有dict 数据格式前提下，将key 和 values 转置，以达到更好的保存数据的。

代码

import pandas as pd 
import numpy as np 
import os 

file_path=r"G:\HEPS_NAMI\results"
 
#存放所有文件名
file_list=[]
#存放所有子文件夹下对应的文件名
file_dict={}
for iroot,idirs,ifiles in os.walk(file_path):
    if not idirs:
        file_dict[iroot]=ifiles[4]

data={}
#遍历所有文件，拼接路径
for k,v in file_dict.items():
    content=[]
    file_name=os.path.join(k,v)
    file=pd.read_csv(file_name,sep=',',encoding='utf-8',header=0)
    content=file.iloc[14,2:]
    p_value=k[25:30]
    data[p_value]=content

data=pd.DataFrame(data)
data2=pd.DataFrame(data.T)
# data.to_csv('data.csv')

print(data2)

输出数据格式

      flux [phs/s] center_H [um] center_V [um] FWHM_H [um] FWHM_V [um]
48       7.477e+12             0      0.004348    0.053576    0.030439
48.1     7.872e+12            -0      0.004307    0.052513    0.030152
48.2     7.769e+12            -0      0.004339    0.051452    0.030371
48.40     8.64e+12             0      0.004329    0.042071    0.030305
48.50    8.807e+12            -0      0.004324     0.04063    0.030271

总结

对dict类型的数据，通常的会用pandas 的DataFrame进行操作，如果仅是对values转置：只需要：

import ...
a_dic={.....}
a_dict=pd.DataFrame(a_dic)
#对值进行转置
data=pd.DataFrame(a_dict.values.T)
#对键值对进行转置
data2=pd.DataFrame(a_dict.T)

这两种转置效果还是有些区别：
需要键时，可以用a_dict.T。
只需要值时，可以用a_dict.values.T

AppleYRY

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录