Python中Pandas库 Dataframe的基本操作:
import numpy as np
import pandas as pd
# 创建一个dataframe
df = pd.DataFrame(np.arange(9).reshape(3,3),index=list('abc'),columns=['c1','c2','c3'])
df['c1'] , df.c1 # 选择表格中的c1列,返回的是Series类型
df[['c1']] # 选择表格中的c1列,返回的是dataframe类型
df[['c1','c2']] # 选择c1, c2列,返回dataframe,注意是[['列名1','列名2']]
df[0:2] # 返回第1行到第2行的所有行,前闭后开
df[1:2] # 返回第1行,如果用df[1]会报错,返回的是dataframe
df.iloc[1:2] #返回第1行,dataframe类型
df.iloc[-1] #返回最后1行,Series类型
df.head() # 返回df的前几行数据,默认为前五行,需要前十行则df.head(10)
df.tail() # 返回df的后几行数据,默认为后五行,需要后十行则df.tail(10)
df.index # 索引
df.columns # 列名
df.values # 以nparray返回df内的数据
df.describe() # 描述性统计
df.T # 转置
# 输出到Excel
writer1 = pd.ExcelWriter('quote2.xlsx')
feeder1.dataframe.to_excel(writer1, sheet_name =