一、About DataFrame
DataFrame 是 Python 中 Pandas 库中的一种数据结构,是一种二维表。它类似 excel,或许说它可能有点像 matlab 的矩阵,但是 matlab 的矩阵只能放数值型值(当然 matlab 也可以用 cell 存放多类型数据),DataFrame 的单元格可以存放数值、字符串等,这就和 excel 表很像。
同时 DataFrame 可以设置列名 columns 与行名 index,可以通过像 matlab 一样通过位置获取数据也可以通过列名和行名定位。
python版本:3.5.2
二、直接创建DataFrame
import pandas as pd
import numpy as np
data=np.random.randn(4,4) #存放在DataFrame里的数据
index=list('ABCD') #行名(或者可以说是索引)
columns=list('ABCD') #列名
df = pd.DataFrame(data, index=index,columns=columns)
print(df)
[Out:]
三、通过字典list创建
data=[{'a':1,'b':2},{'b':2,'a':9}]
df = pd.DataFrame(data)
print(df)
[Out:]
列头是字典key的并集:
data=[{'c':1,'b':2},{'b':2,'a':9}]
df = pd.DataFrame(data)
print(df)
[Out:]
四、通过list字典创建
字典的key就是列头,每个key都是一个list,而且必须是等长度的list
data = {'a':['m','n','t'],'m':['a','b','c']}
df = pd.DataFrame(data)
print(df)
[Out:]