Python - Pandas
- 输出所有的列名
df.columns
- 修改列名
# 修改所有的列名
df.columns = ["",""......]
# 修改某一列列名(重新赋值给一个新的DataFrame)
df = df.rename(columns={"列名":"修改后的列名"})
- 统计某一列中不同值出现的次数
# 1.
df.groupby("列名").nuinque(dropna=Flase)
# 2.
df["列名"].value_counts()
- 空值填充
df.fillna(value=?)
- 根据列删除重复值
df.drop_duplicates("列名" , inplace = True)
- 将列转行为list
df.列名.tolist()
- 将DataFrame保存为Excel
df.to_excel("文件名.xlsx")
- 交换两列的位置
df = df.reindex(columns=["列1" , "列2"])
- 按照某一列的值的大小进行排序
df = df.sort_values("列名")
- 查看数值型的汇总统计
df.describe()
- 数据分箱操作
box = [0 , 6000 , 20000 , 100000]
box_name = ["低" , "中" , "高"]
df["cut_salary"] = pd.cut(df["salary"] , box , labels=box_name)
df