pandas.Dataframe对象常用操作总结
读入数据默认最大显示行数和列数设置
pd.set_option('display.max_columns', None/具体列数) 设置为None显示所有
pd.set_option('display.max_rows', None/具体行数)
增加操作
-
增加行用
pd.DataFrame.loc[行] = data
-
#增加
行/列
均直接在原表修改,不想在原表进行修改,可以使用new = pd.DataFrame.copy()
生成新对象new
,再进行增删操作 -
增加列用
pd.DataFrame[列] = data
删除操作
- 删除行用
pd.DataFrame.drop([行],inplace=False/Ture)
- #
inplace
默认为False
,为True
时直接在原DataFrame对象
进行修改,否则生成新对象 - 删除列用
pd.DataFrame.drop([列],axis=1/'columns',inplace=False/Ture)
更改行索引、列名
import pandas as pd
# 行索引
# 更改部分行索引名
pd.DataFrame.rename(index={'原来索引名':'新索引名',……},inplace=True/False)
# 注意index后面给的参数是字典形式的“原索引名”和“新索引名”的键值对,inplace默认为False,表示不在原对象上修改,否则直接在原对象上修改
# 更改整个行索引名
pd.DataFrame.index = [修改的索引名序列] # 长度要一致
pd.DataFrame.reset_index(drop=False/True) # drop=True 时,删除原来的索引,用新的从0开始的数字索引代替
# 列名
# 更改部分列名
pd.DataFrame.rename(columns={'原来索引名':'新索引名',……},inplace=True/False)
# 更改整个列名
pd. DataFrame.columns = [修改的列名序列] # 长度要一致