Series 和 Dataframe格式的数据处理工作,有很多常用的也比较巧妙的小方法,现总结下,方便理解应用。
本文会已方法基础格式+代码样例的形式加以讲解说明。
一 基础方法介绍
Series 和 Dataframe
import numpy as np
import pandas as pd
#from pandas import Sereis, DataFrame
df = pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('wxyz'))
ser = pd.Series(np.arange(3.))
df = pd.DataFrame(data, columns = ['A', 'B', 'C', 'D'])
行列
多种形式,灵活应用
''' 行 '''
df.loc
df.irow(0) = 1
df.head() #返回df的前几行数据,默认为前五行,需要前十行则df.head(10)
df.tail() #返回df的后几行数据,默认为后五行,需要后十行则df.tail(10)
df.iloc[-1] #选取DataFrame最后一行,返回的是Series
df.iloc[-1:] #选取DataFrame最后一行,返回的是DataFrame
df.loc[df['A'] == 'cutoff',