Dataframe的一些操作合集

  1. 指定列进行排序
df=df.sort_values(by='col_name')
  1. 重命名列名
df.rename(columns={'ori_col_name': 'new_col_name'}, inplace=True)
  1. 按照原有的列生成一个新的df
df = df.reindex(columns=["col_name1", "col_name2"])
  1. 根据指定条件删除df一行
df = df.drop(df[df['col_name']=='val'].index)
  1. 统计某一列中一个值出现的次数
sub_df = df["col_name"].value_counts(ascending=True).reset_index(name='counts')
sub_df.rename(columns={'index':'col_name'},inplace=True)
  1. 对一列上的值进行累加
df['cumsum'] = df['cnts'].cumsum()
  1. 将一个包含多个元素的列分割成一个列表或者拆分成多列
df = pd.DataFrame({'multi_vals':['23-45','45-67']})
df['val_sp'] = df['multi_vals'].str.split('-')
'''
multi_vals val_sp
23-45      [23,45]
45-67      [45,67]
'''
df['val1'], df['val2'] = df['multi_vals'].str.split('-', 1).str
'''
multi_vals val_sp   val1  val2
23-45      [23,45]  23    45
45-67      [45,67]  45    67
'''
  1. 将两个df连接在一起
pd.merge(df1, df2, on="key_col_name", how="left")

how关键字指定按何种方式连接。

  • left:左外连接。左边的df的所有数据保留,右边的df只保留和左边的key_col_name相等的行。
  • right:右外连接。类比左外连接。
  • outer:全外连接
  • inner:内连接
  • cross:交叉连接
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值