利用groupby对dataframe分组并写入csv文件

groupby:
实现dataframe某一列相等的行的其他列的聚合(分组)
groupby分组后,通过apply(list)可以把column_index(1个值)对应的column_1(1个或多个值)变为list格式,输出为len(column_index)个( 一个index+1个list)的组合,组合类型为array

result_groupby=df['column_1'].groupby(df['column_index']).apply(list)

若要将groupby的结果写入csv文件:
首先转化为字典,字典的键为groupby分组的索引,值为被分组列聚合来的list

result_dict=dict(result_groupby)

遍历字典的每一项,并将键和值组合成文件中每一行的格式:

#文件路径
text_path=r''
#使得文件可写入,codecs库可保证文件写入不乱码
f=codecs.open(train_list,'wb','gbk')
for key,value in result_dict.items():
    row_text=key
    #文件要求写入固定个数个值
    if len(value)>=num:    
	    #文件每行格式要求值的每一个元素之间,用逗号隔开
	    for i in range(len(num)):
	        row_text=row_text+','+value[i]
	        f.write('{0}\n'.format(row_str))
	```




  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值