pandas基本操作
读取文件
读取CSV
import pandas as pd
df=pd.read_csv("data.csv".sep='\t')
pd.read_csv("data.csv".sep='|')
读取excel
pd.read_excel("data.xlsx")
df=pd.read_excel("https://www.gairuo.com/file/data/dataset/team.xlsx")
索引
建立索引
df.set_index('name')
df.set_index(['name',"team"])
df=df.set_index('name')
df.set_index('name', inplace=True)
df.set_index('month', drop=False)
df.set_index('month', append=True)
重置索引
df.reset_index()
数据的信息
查看样本
df.head()
df.tail()
df.sample()
数据的形状
df.shape
数据的基础信息
df.info
数据的类型
df.dtypes
s.dtype
行列索引的内容
df.axes
其他信息
df.index
df.columns
df.values
df.ndim
df.size
df.empty
df.keys()
统计计算
描述统计
df.describe()
df.mean()
df.Q1.mean()
df.mean(axis="columns")
df.mean(1