一、认识DataFrame数据结构
DataFrame 是一个表格型的数据结构。它含有一组有序的列。每列可以是不同类型的值,可以看成DataFrame是由Series组成的字典。每一列都是一个Series,这些Series共用同一个索引。DataFrame既有行标签(索引),也有列标签。
注意大小写
:DataFrame
![](https://i-blog.csdnimg.cn/blog_migrate/cd0b7e9d2a668d7f6a50ec348c28c876.png)
二、创建Dataframe的方法
-
基础语法: pandas.Dataframe(date,index,columns,dtype,copy)
-
参数说明:
date: 一组数据(ndarray,series,dict,lists,DataFrame等)
index: 索引值,或者称为行标签,默认为
RangeIndex (0, 1, 2, …, n)
columns: 列标签,或者可认为是列名,默认为
RangeIndex (0, 1, 2, …, n)
dtype: 数据类型
copy: 拷贝数据,默认为False
-
备注:
date应为二维的数据结构。当date为一维数据时,根据轴的理解,最外层的轴为axis=0,即列轴,所以生成的DataFrame为一列数据,而不是一行。或者说这是一个列表,顾名思义,是一列的形式
。
1、字典类
-
字典本身的keys,values即形成二维数据结构,因此values值只能是一维的(字典除外),否则报错。
-
keys值作为列标签columns,keys对应的values值作为一列
-
指定列标签时,由于字典本身的特性,可只取指定的keys;可指定列的顺序;可取字典keys值以外的值作为列标签,此时对应的数据内容values用NAN填充
1.1 数组、列表、元组组成的字典
-
每个values元素的个数应相等
1.2 Series组成的字典
-
若每个values值元素个数不一致,可用NAN补齐。而对于数组、列表、元组则不能如此操作
1.3 字典组成的字典
-
外层字典keys值作为列标签;内层字典keys值作为行标签;行标签、列标签均可指定范围和顺序,也可取原有keys以外的值
![](https://i-blog.csdnimg.cn/blog_migrate/962dc4ed18794dd0b38b7224fc257078.png)
![](https://i-blog.csdnimg.cn/blog_migrate/6167adc56dfc920277e140b8f27f8f0a.png)
2、列表类
-
需注意轴axis的理解,最外层为axis=0,即列;里面一层为axis=1,即行
2.1 2维列表
2.2 字典组成的列表
-
注意keys值作为列标签,缺失数据位置填充NAN
2.3 Series组成的列表
-
缺失数据位置填充NAN
![](https://i-blog.csdnimg.cn/blog_migrate/4c433935e061ccb01009a4cddb8f71cf.png)
第一次写CDNS哦,请各路大佬多多指教!!!走过路过的小伙伴觉得用有快来互动!!!练习代码也会分享。