pandas常用指令

✔设置pandas数字显示模式:

pd.options.display.float_format = '{:20,.2f}'.format

✔设置pandas显示所有的columns:

pd.set_option('max_columns', 1000)

✔获取DataFrame的形状:

df.shape

✔获取DataFrame的列名:

df.columns

✔指定DataFrame的index

df.set_index(['date'], inplace=True)

✔LEFT JOIN 的pandas实现:

trnsact = pd.merge(df_train, df_items[['item_id','item_category_id']], how='left', on='item_id')

✔将日期转换为pd.datetime:

df['date']  = pd.to_datetime(df.date, format='%d.%m.%Y')

✔获取DataFrame的index:

df.index.values -- 返回一个numpy.ndarray

✔将日期分为 年 月 日 三列:

df['year'], df['month'], df['day'] = df.date.dt.year, df.date.dt.month, df.date.dt.day

df[['year','month','day']] = df.date.apply(lambda i: pd.Series(i.strftime("%Y,%m,%d").split(",")))

✔另一种通过str来分割日期的方法:

trnsact[['day', 'year', 'month']] = trnsact.date.str.split('_', expand=True)

✔GROUPBY 的 pandas 实现: 将收入(rev.)按照shop_id分组并求和, 并按照第一col.进行倒序排序:

grouped = sept_trn['revenue'].groupby(sept_trn['shop_id'])
sept_total = grouped.sum()
sept_total = sorted(sept_total.items(), key=lambda i: i[1], reverse=True)

✔计算频率方法, 如可以计算星期几出现的频率, 此指令返回一个Series:

df.weekdays.value_counts()

✔分割星期几的方法:

df['weekdays'] = df.date.dt.dayofweek

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值