0.摘要
Pandas相当于是Numpy的升级版本。在numpy中,核心的数据类型为ndarray;而在Pandas中,核心的数据核心Series和DataFrame。本文主要介绍pandas库中的DataFrame类型。
1.DataFrame类型简介
DataFrame主要由三部分构成:data,index和columns。与Series类型相比,多了一个columns部分。
可以看出,DataFrame相当于是Series类型的三维拓展。
如果columns只有一列,则DataFrame就是一种特殊的Series。
2.DataFrame类型的创建
DataFrame的创建方式主要有三种:
方式一:使用二维数组创建
import pandas as pd
import numpy as np
n = np.arange(20, dtype=float).reshape(5,4)
frame1 = pd.DataFrame(n)
print(frame1)
由于在创建过程中并没有指定index和columns,因此,pandas使用了默认的index和columns,即以0为起点的数组。
方式二:指定index和columns
import pandas as pd
import numpy as np
n = np.arange(20, dtype=float).reshape(5,4)
index = ['index1', 'index2', 'index3'