以下是关于python pandas中dataframe的一些技巧,临时起意整理一下,方便查用
1、数据连接
df = pd.merge(df1, df2, how="inner", on="product_type")
how: One of ‘left’, ‘right’, ‘outer’, ‘inner’. 默认inner。inner是取交集,outer取并集。
2、删除A列包含某字符串的行
df = df[~ df['A'].str.contains('银饰')]
3、A列为空时用B列的值填充
df.A.fillna(df.B, inplace=True)
4、某一列为空时用某个值填充
df["A"] = df["A"].fillna(1)
5、删除某一列
df.drop(["A"], axis=1, inplace=True)
6、对某一列求和
sum_A = df["A"].sum()
7、A列小于B列时用D列更新C列
df.loc[df.A < df.B, "C"] = df.D
8、删除A列中值为inf的行,需要引入numpy
df = df[~ np.isinf(df['A'])]
9、修改列名
df.rename(columns={'A': 'A1', 'B':'B1'}, inplace=True)
10、计算某一列为某几列的均值
df["M"] = df[["A", "B", "C"]].mean(axis=1)
11、删除某些列存在空值的行
df.dropna(axis=0, subset=["A", "B"], inplace=True)
12、求误差|B-A|/A
df["E"] = (df["B"] - df["A"]).apply(abs) / df["A"]
author:蓝何忠
email:lanhezhong@163.com