前言:
本文为整理/大杂烩类文章,会根据实际情况不断更新。
本文是笔者对工作内容的一个大致梳理,为了避免再犯同样的错误。由于是由记忆碎片拼凑而成,因此部分内容暂时没有相应的例子,但后续会不断完善。
若已有文章详细讲解某部分内容,笔者将仅附上相关链接,而不再作具体说明。
一、常规操作
注:主要参考链接“Pandas的常用操作总结”和
(一)增
1.df横向叠加:df_concat = pd.concat([df1, df2, ...], axis=1)
2.df纵向叠加:df1.append([df2, df3]) or df_concat = pd.concat([df1, df2, df3])
(3.在指定位置插入行/列等:待补充)
(二)删
# 函数:df.drop(),删除不需要的行或列
# df2 = df2.drop(index=['ZhangFei'])
# df2 = df2.drop(columns=['chinese'])
# df2 = df2.drop(['xx'], axis=1) drop函数默认删除行,axis=1在列的方向上,删除'xx'列
# df2.drop(['xx'], axis=1, inplace=True) inplace设置为True,原数组直接被替换,等同于上面
# 参考:https://blog.csdn.net/HARD_FAN/article/details/108182010
(三)改
1.去重复
df.drop_duplicates():三种模式——保留第一项,保留最后一项,重复均删除;由keep参数设置
2.改列名
df.columns = ['xxx', 'xxx', ...]
3.改数据格式(data format)
# e.g:将chinese字段值改成str或者int64类型
# df3['chinese'].astype('str')
# import numpy as np
# df3['chinese'].astype(np.int64)
4.列名大小写转换
a.小: df3.columns=df3.columns.str.upper()
b.大: df3.columns=df3.columns.str.lower()
c.首字母大写: df3.columns=df3.columns.str.title()
(四)查
该链接中代码行数为115-130:Pandas的常用操作总结
该链接涵盖了大部分关于查询的内容: