DataFrame可以看作是一张二维表格,类似于电子表格或SQL表,它由行和列组成。每列可以包含不同数据类型的数据(整数、浮点数、字符串、布尔值等),但在每列中的数据类型必须相同。每行可以使用索引进行标识,可以是数字、日期、字符串等。
导包
import numpy as np
import pandas as pd
初识DataFrame
data = {
'a':[1,2,3,4],
'b':(5,6,7,8),
'c':np.arange(9,13)
}
frame = pd.DataFrame(data)
frame
查看行索引 index属性
# index属性查看行索引
frame.index
查看列索引 columns属性
# index属性查看行索引
frame.index
查看值 values属性
#values属性查看值
frame.values
指定行索引
# 用index函数指定行索引
frame = pd.DataFrame(data,index=['A','B','C','D'])
frame
指定列索引
# 用columns函数指定列索引
frame = pd.DataFrame(data,index=['A','B','C','D'],columns=['a','b','c','d'])
frame
构造dataframe
二维ndarray 构造dataframe
# 二维ndarray 构造dataframe
arr1 = np.arange(20).reshape(5,4)
frame1= pd.DataFrame(arr1)
frame1
字典构成的字典造dataframe
#字典构成的字典造dataframe
#字典嵌套
data1 = {
'a':{'apple':5,'banana':6,'peach':5.4},
'b':{'apple':6.1,'banana':7.1,'peach':6.4},
'c':{'apple':4.5,'peach':6.3}
}
pd2=pd.DataFrame(data1)
pd2
字典构成的列表造dataframe
#字典构成的列表造dataframe
list1=[
{'apple':5,'banana':6,'peach':5.4},
{'apple':6.1,'banana':7.1,'peach':6.4},
{'apple':4.5,'peach':6.3}
]
pd3=pd.DataFrame(list1)
pd3
T转置
pd4 = pd.DataFrame(np.arange(12).reshape(4,3),index=['A','B','C','D'],columns=['a','b','c'])
pd4
pd4.T