2017.07.04回顾 dataframe组合 groupby sort to_csv不存index

今天主要是建模的事情,小结一下

1、我使用了6种不同的y定义,然后写了一个程序去计算平均iv,这个程序中主要是对pandas的回顾

  • 多dataframe的组合,
    pd.concat((df1,df2,df3,df4,df5,df6),ignore_index=True)
    默认axis=0,就按行组合,相同的表头会忽略掉,重新起序号,用ignore_index = True
  • df的groupby,这个是第一次使用,
    df_total.groupby(['column_name']).sum()/6
    后面可以接聚合函数sum()或者mean()等,我后头除以6是对里面每一个元素除以了6,我突然发现我并没有指定列,另外一列是IV,但是最后的结果是达到了我的预期,这个里是个坑啊,需要有空来填啊
  • 然后就dataframe排序,还是用的一个即将废弃的方法,df.sort(columns='IV', inplace=True, ascending = 0),新的用法是
    df_avg.sort_values(by='IV',inplace=True, ascending = 0)

  • df.to_csv有个参数可以不存储index,这个参数就叫index=False就可以了,default是True
2、尝试写真正的y定义,
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值