随机生成一个8*4的二维数组
df = pandas.DataFrame(data=np.random.randint(60,100,size=(8,4)),columns=['a','b','c','d'], index=['A','B','C','D','E','F','G','H'])
1. 取单行(/列)使用一个方括号df [ 0 ] (/df [ :,0 ]),如果是要取多行/列需要使用二维的即两个方括号df [ [ 0,1 ] ] (/df [ :,[ 0,1 ] ])。取单个元素 df [ 0,1 ]
2. 行切片取值:df [ start : end: step ], 如果step是 -1, 则是把行倒过来取值。列切片取值:df [:,start : end: step]
3. loc和iloc的区别
loc是通过显式索引取值 (相当于行名和列名),取整行:df.loc[ 'A' ],取单个元素:df.loc[ 'A' , 'a' ],取多个元素:df.loc [ [ 'A' , 'B' , 'C' ],'a' ]
iloc是通过隐式索引取值 (永远都是0,1...),取整行:df.iloc[ 0 ],取单个元素:df.iloc[ 0,1 ],取多个元素:df.iloc [ [ 1,3,5 ],2 ]
- df索引和切片操作
- 索引:
- df[col]:取列
- df.loc[index]:取行
- df.iloc[index,col]:取元素
- 切片:
- df[index1:index3]:切行
- df.iloc[:,col1:col3]:切列
4. 聚合函数 sum(),mean(),median(),max(),min()
默认都是对column 做操作,即axis = 0