Python语言学习之pandas之DataFrame:DataFrame的简介、常用函数(如DataFrame重命名列名方法)等详细攻略
目录
DataFrame的简介
DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表。网友说有点像matlab的矩阵,但matlab的矩阵只能放数值型值(当然matlab也可以用cell存放多类型数据),DataFrame的单元格可以存放数值、字符串等,这和excel表很像。同时DataFrame可以设置列名columns与行名index,可以通过像matlab一样通过位置获取数据也可以通过列名和行名定位。
DataFrame的常用函数
1、DataFrame重命名列名的两种方法
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(12).reshape(3,4))
print(df)
#T1、使用columns重命名
df.columns = list('abcd')
print('使用columns重命名','\n', df)
#T2、使用rename()方法重命名
df.rename(columns={'b':'two', 'd':'four'}, inplace = True)
print('使用rename()方法重命名','\n', df)
2、DataFrame.sort_values()函数:排序
## 参数
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')
#### 参数说明
axis:{0 or ‘index’, 1 or ‘columns’}, default 0,默认按照索引排序,即纵向排序,如果为1,则是横向排序
by:str or list of str;如果axis=0,那么by="列名";如果axis=1,那么by="行名";
ascending:布尔型,True则升序,可以是[True,False],即第一字段升序,第二个降序
inplace:布尔型,是否用排序后的数据框替换现有的数据框
kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心
na_position : {‘first’, ‘last’}, default ‘last’,默认缺失值排在最后面