pandas读取字典（dict）数据

最新推荐文章于 2025-04-02 10:54:28 发布

Data+Science+Insight

最新推荐文章于 2025-04-02 10:54:28 发布

阅读量1.1w

点赞数 3

文章标签：机器学习 python 数据挖掘深度学习神经网络

本文链接：https://blog.csdn.net/zhongkeyuanchongqing/article/details/118103008

版权

本文详细介绍了如何使用pandas DataFrame.from_dict方法将字典转换为DataFrame，包括默认列方式和索引方式，并展示了如何处理faker生成的仿真数据。重点讲解了在不同orient参数下的操作和注意事项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

pandas读取字典（dict）数据

pandas.DataFrame.from_dict

# 默认orient ='columns'

# 默认orient ='columns'
data = {'col_1': [3, 2, 1, 0], 'col_2': ['a', 'b', 'c', 'd']}
pd.DataFrame.from_dict(data)

#设置orient = index

data = {'row_1': [3, 2, 1, 0], 'row_2': ['a', 'b', 'c', 'd']}
pd.DataFrame.from_dict(data, orient='index')

# 注意只有是orient = 'index'的时候才可以手动指定列名称, 否则会报错

# 注意只有是orient = 'index'的时候才可以手动指定列名称
pd.DataFrame.from_dict(data, orient='index',
                       columns=['A', 'B', 'C', 'D'])

# 错误代码

# 注意只有是orient = 'index'的时候才可以手动指定列名称
pd.DataFrame.from_dict(data, orient='columns',
                       columns=['A', 'B', 'C', 'D'])

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-80-4b25eb1c16ee> in <module>
      1 # 注意只有是orient = 'index'的时候才可以手动指定列名称
      2 pd.DataFrame.from_dict(data, orient='columns',
----> 3                        columns=['A', 'B', 'C', 'D'])

D:\anaconda\lib\site-packages\pandas\core\frame.py in from_dict(cls, data, orient, dtype, columns)
   1303         elif orient == "columns":
   1304             if columns is not None:
-> 1305                 raise ValueError("cannot use columns parameter with orient='columns'")
   1306         else:  # pragma: no cover
   1307             raise ValueError("only recognize index or columns for orient")

ValueError: cannot use columns parameter with orient='columns'

# 使用faker包生成仿真数据（dict，字典格式）并使用pandas读取

# !pip install faker
from faker import Faker
fake = Faker()

#生成一个人相关的详细信息，以字典的形式进行组织
fake.profile()

# 生成字典并使用pandas读取

pd.DataFrame.from_dict(fake.profile(),orient = 'index')

# 获取dict的键

columns = list(fake.profile().keys())
columns

# pandas读取dict数据并进行转置

pd.DataFrame.from_dict(fake.profile(),orient = 'index').T

# 生成多条仿真数据并用pandas dataframe进行读取

#通过for循环把faker生成的数据组织起来存放在pandas dataframe中
# 生成list of dict
people_list = []
for i in range(10):
    people_list.append(fake.profile())


df = pd.DataFrame(people_list)
df.head(1)