最近在学习pandas,在这里记录一下笔记。
一)创建pandas二维数组
import pandas as pdimport numpy as nps=pd.date_range('20200101',periods=6)df=pd.DataFrame(np.random.randn(6,4),index=s,columns=list('abcd'))print(df)
效果
第3行的代码,生成日期序列,如上图第一列所示
第4行的代码,生成一个pandas的DataFrame对象的二维数据
二)查看数据
print(df.head())
上面的代码,显示开头5行的数据
print(df.head(3))
上面的代码,显示开头3行的数据
print(df.tail())
上面的代码,显示倒数5行数据
print(df.tail(3))
上面的代码显示倒数3行的数据
三)数据统计摘要
print(df.describe())
效果
这个函数统计每一列的个数、平均数、标准差、最小值、四分之一位数、中位数、四分之三位数、最大值
四)转置
print(df.T)
效果
五)按值排序
print(df.sort_values(by='b'))
上面的代码,按b列的值升序排序
六)选择数据
选择一列
print(df['a'])
效果
选择一行
print(df.iloc[3])
效果
七)筛选
print(df[df.a>0])
筛选a列大于0的行
效果
print(df[df>0])
显示DataFrame大于0的数据
效果