有关于pandas中的DataFrame,我们需要对其的基本信息有一个大致的了解,一下列出来的一些关于DataFrame的函数,可以帮助我们快速查找二维矩阵信息。下表可快速查找所需函数。
DataFrame 的基础属性
- df.shape # 形状,行数列数
- df.dtypes # 列数据类型
- df.ndim # 数据维度
- df.index # 行索引
- df.columns # 列索引
- df.values # 对象值,二维ndarray数组
DataFrame 的整体情况查询
- df.head() # 显示头部几行
- df.tail() # 显示尾部几行
- df.info() # 相关信息概览:行数,列数,列索引,列非空值个数,列类型,内存占用
- df.describe() # 快速综合统计结果:计数,均值,标准差,最大值,四分位数,最小值
import pandas as pd
import numpy as np
#创建二维一个正态分布随机数组
d_1 = pd.DataFrame(np.random.randn(6,6),columns=list("abcdef"))
print(d_1)
#用字典传入数据
d_2 = pd.DataFrame({'A' : 6.,
'B' : pd.Timestamp("20220615"),
'C' : pd.Series(1,index=list(range(6)), dtype='float32'),
'D' : np.array([6] * 6, dtype='int64'),
'E' : pd.Categorical(["test","train","test","train","test","train"]),
'F' : 'info' })
print(d_2)
#数据查看
print(d_2.dtypes) #查看d_2的类型
print(d_2.shape) #查看d_2的形状
print(d_2.ndim) #查看d_2的维度
print(d_2.head(3)) #查看d_2的前三行数据
print(d_2.tail(3)) #查看d_2的后三行数据
print(d_2.index) #利用index查看
print(d_2.columns) #利用columns查看
print(d_2.values) #利用values查看
print(d_2.info()) #利用info()查看d_2的基本信息
#数据统计
print(d_1.describe()) #利用describe()快速查看统计结果
print(d_1.T) #矩阵转置