可以用来构造Pandas DataFrame的数据源格式

本文详细介绍了如何使用各种数据格式构建Pandas DataFrame,包括二维ndarray、数组、列表或元组组成的字典、NumPy的结构化/记录数组、由Series组成的字典、字典组成的字典、字典或Series的列表、以及由列表或元组组成的列表。每个数据源都有其特定的要求和应用场景,如所有序列必须长度相同,外层字典的键作为列,内层键作为行索引等。
摘要由CSDN通过智能技术生成

在这里插入图片描述
以上图片截取自利用python进行数据分析的中文翻译。感谢翻译者。

构造DataFrame的数据格式

import pandas as pd
import numpy as np

二维ndarray

arr2d = np.random.randint(0,9,size=(5,4))
arr2d
array([[6, 3, 0, 4],
       [2, 5, 5, 0],
       [3, 7, 6, 5],
       [8, 3, 7, 6],
       [8, 4, 2, 6]])
df_arr2d = pd.DataFrame(arr2d)
df_arr2d
0 1 2 3
0 6 3 0 4
1 2 5 5 0
2 3 7 6 5
3 8 3 7 6
4 8 4 2 6
cols = ['A','B','C','D']
idx = ['a','b','c','d','e']

df_arr2d = pd.DataFrame(arr2d,index=pd.Index(idx),columns=cols)
# 或
# df_arr2d = pd.DataFrame(arr2d,index=idx,columns=cols)
df_arr2d
A B C D
a 6 3 0 4
b 2 5 5 0
c 3 7 6 5
d 8 3 7 6
e 8 4 2 6

由数组、列表或元组组成的字典

所有序列长度必须相同

数组组成的字典

import random

arr1 = np.random.randint(0,9,size=10)
arr2 = np.random.randint(0,9,size=10)
arr3 = np.random.randint(0,9,size=10)
dic_array = {
   'A':arr1,'B':arr2,'C':arr3}
DF_dic_array = pd.DataFrame(dic_array)
DF_dic_array
A B C
0 1 4 2
1 2 2 1
2 0 2 2
3 6 3 1
4 2 4 4
5 3 4 5
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值