【无标题】

最新推荐文章于 2024-10-01 04:50:10 发布

Marshal～

最新推荐文章于 2024-10-01 04:50:10 发布

阅读量102

点赞数

分类专栏： python知识补充文章标签：算法

原文链接：https://blog.csdn.net/carol_in_love/article/details/81435837

版权

python知识补充专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文介绍了Python内置模块itertools.groupby的功能和用法，包括如何根据字典的键进行分组，以及如何自定义分组规则。通过示例展示了如何对数据进行排序和分组，以及在不排序的情况下如何正确使用groupby。同时，文章还探讨了在实际应用中，如何确保相同key的元素被正确分组到同一组内。

摘要由CSDN通过智能技术生成

关于Python itertools.groupby
Python itertools.groupby
groupby()把迭代器中相邻的，指定特征重复的元素挑出来放在一起

list中：key相同的dict元素
通常使用itemgetter()参数规定分组依据
也可编写简单的lambda函数传入key参数，作为分组依据（key参数必须传入函数）

from operator import itemgetter #itemgetter用来取dict中的key，省去了使用lambda函数
from itertools import groupby
d1={'name':'zhangsan','age':20,'country':'China'}
d2={'name':'wangwu','age':19,'country':'USA'}
d3={'name':'lisi','age':22,'country':'JP'}
d4={'name':'zhaoliu','age':22,'country':'USA'}
d5={'name':'pengqi','age':22,'country':'USA'}
d6={'name':'lijiu','age':22,'country':'China'}
lst=[d1,d2,d3,d4,d5,d6]

lst.sort(key=itemgetter('country')) #先排序，再进行groupby。lst排序后自身被改变
lstg = groupby(lst,itemgetter('country')) 
#lstg = groupby(lst,key=lambda x:x['country']) 等同于使用itemgetter()

for key,group in lstg:
    print(key,list(group))

#返回：
China [{'name': 'zhangsan', 'age': 20, 'country': 'China'}, {'name': 'lijiu', 'age': 22, 'country': 'China'}]
JP [{'name': 'lisi', 'age': 22, 'country': 'JP'}]
USA [{'name': 'wangwu', 'age': 19, 'country': 'USA'}, {'name': 'zhaoliu', 'age': 22, 'country': 'USA'}, {'name': 'pengqi', 'age': 22, 'country': 'USA'}]

自定义分组
当对groupby()传入key参数，实际上挑选规则通过此函数完成。只要作用于函数的两个相邻元素返回的值相等，这两个元素就被认为在一组，函数返回值作为key。

import itertools

def height_class(h):
    if h>180:
        return 'tall'
    elif h<160:
        return 'short'
    else:
        return 'middle'

friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]

for m,n in itertools.groupby(friends,key = height_class):
    print(m,list(n))

#返回：
tall [191]
short [158, 159]
middle [165, 170, 177]
tall [181, 182, 190]

由于191与181,182,190不相邻，因此分组结果不在一组。

欲使所有相同key的元素在一组中，要在list传入groupby()之前进行排序

import itertools

def height_class(h):
    if h>180:
        return 'tall'
    elif h<160:
        return 'short'
    else:
        return 'middle'

friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]

friends = sorted(friends,key = height_class)

for m,n in itertools.groupby(friends,key = height_class):
    print(m,list(n))

#返回：
middle [165, 170, 177]
short [158, 159]
tall [191, 181, 182, 190]