DataFrame是pandas数据处理中一种很常用的数据结构。我们可以把DataFrame看成是一张二维数据表,相对于Series数结构,DataFrame可以由多列,因此他的功能比Series更加强大,我们可以把DataFrame看成是一张excel表格的sheet,用它就可以完成很多原来excel需要手动完成的工作,从而实现数据处理自动化了,想想也是很激动的。
首先,我们要学会如何创建DataFrame数据结构,python中我们可以使用字典作为参数,利用DataFrame的构造函数对数据帧进行初始化。这点其实Series数据结构也是一样的。特别要注意的是,DataFrame的D和F要大写,其实Series的S也是要大写的,不大写的话python会报错。
我们可以使用以下的代码来进行演示:
import pandas as pd
dict_data = {
'student':["Li Lei","Han Meimei"