在pandas中,DataFrame数据格式是最为常用的一种格式,其创建方式也有多种,本篇介绍下详细的基础使用方式。
在上一篇中已经引到过一部分DataFrame部分内容,先贴出来温习一下
一.DataFrame数据类型
在pandas中,还有一种常用的数据类型DataFrame,其主要功能是针对二维数据的处理,同时也是Series的容器。
同样,举个栗子:
a = pd.DataFrame(np.arange(20).reshape(4,5))
print(a)
>>>
0 1 2 3 4
0 0 1 2 3 4
1 5 6 7 8 9
2 10 11 12 13 14
3 15 16 17 18 19
#我们可以看到,在数组生成以后,使用DataFrame格式化数据,可以使横向和纵向同时有了索引
如何给DataFrame的数据设定索引
在创建DataFrame时,可以通过增加两个参数,分别是index和columns,实质上使类似与数据库中的表结构的,方法与设置Series时相同,只是多了一个参数。
可以通过字典或列表给定的方式设定索引 ,也可以通过加入参数(index=list,columns=list)去设定
通过传入dict数据生成DataFrmae
#使用dict数据传入,key就成为了columns,value的list中的index就会按照顺序变为DataF