使用loc,iloc访问DataFrame数据
DataFrame.loc[行索引名称或条件, 列索引名称]
用法:DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False)
参数说明:
labels 删除的行列的名字
axis 默认为0,删除行,删除columns axis=1;
index 删除的行
columns 要删除的列
inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新dataframe;
inplace=True,则会直接在原数据上进行删除操作,删除后无法返回。
df = df.dropna(axis=0)
df = df.dropna(axis=1)
单独计算某列的统计值
df['one'].sum()
df['one'].mean()
df['one'].count()
df['one'].max()
df['one'].min()
修改数据类型
df['one']=pd.DataFrame(df['one'],dtype=np.float)
修改列名(需要写上所有列名,包括需要修改的和不需要修改的):
df.columns = ['first','second','all']
修改列名(只需写上需要修改的列)
df.rename(columns = {'1':'one','2':'two'},inplace = True)
重排序(by可以取多个列名,默认升序):
df = df.sort_values(by=['1'],ascending = True)
df = df.sort_index(axis = 0,ascending = True,by = '1')
df = df.sort(columns = ['1'],axis = 0,ascending = True)