python中itertools groupby函数是干嘛的_Python如何利用itertools.groupby() 根据字段将记录分组...

本篇文章给大家带来的内容是关于Python如何利用itertools.groupby() 根据字段将记录分组,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

1、需求

有一系列的字典或对象实例,我们想根据某个特定的字段来分组迭代数据。

2、解决方案

itertools.groupby()函数在对数据进行分组时特别有用。

实例:from operator import itemgetter

from itertools import groupby

rows=[

{'name':'mark','age':18,'uid':'110'},

{'name':'miaomiao','age':28,'uid':'160'},

{'name':'miaomiao2','age':28,'uid':'150'},

{'name':'xiaohei','age':38,'uid':'130'},

]

#首先根据age排序

rows.sort(key=itemgetter('age'))

for age,items in groupby(rows,key=itemgetter('age')):

print(age)

for i in items:

print(i)

结果:18

{'name': 'mark', 'age': 18, 'uid': '110'}

28

{'name': 'miaomiao', 'age': 28, 'uid': '160'}

{'name': 'miaomiao2', 'age': 28, 'uid': '150'}

38

{'name': 'xiaohei', 'age': 38, 'uid': '130'}

3、分析

python实现一键多值字典的方法实现

函数groupby()通过扫描序列找出拥有相同值(或是由参数key指定的函数所返回的值)的序列项,并将它们分组。groupby()创建了一个迭代器,而在每次迭代时都会返回一个值(value)和一个子迭代器(sub_iterator),这个迭代器可以产生所有在该分组内具有该值得项。

在这里重要的是首先要根据age对数据进行排序。因为groupby()不会排序。

如果只是简单的根据日期将数据分组到一起,放进一个大的数据结构中以允许进行随机访问,那么利用defaultdict()构建一个一键多值字典可能会更好:from collections import defaultdict

rows=[

{'name':'mark','age':18,'uid':'110'},

{'name':'miaomiao','age':28,'uid':'160'},

{'name':'miaomiao2','age':28,'uid':'150'},

{'name':'xiaohei','age':38,'uid':'130'},

]

rows_by_age=defaultdict(list)

for row in rows:

rows_by_age[row['age']].append(row)

for a in rows_by_age[28]:

print(a)

结果:{'name': 'miaomiao', 'age': 28, 'uid': '160'}

{'name': 'miaomiao2', 'age': 28, 'uid': '150'}

不考虑排序的话,defaultdict方法一般比groupby快。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值