python中collections模块的使用

最新推荐文章于 2024-05-30 13:49:36 发布

贝壳er

最新推荐文章于 2024-05-30 13:49:36 发布

阅读量230

点赞数 1

分类专栏：其他文章标签： collections python

本文链接：https://blog.csdn.net/wlx19970505/article/details/111204387

版权

其他专栏收录该内容

2 篇文章 0 订阅

订阅专栏

官方API链接

namedtuple

collections.namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)

namedtuple是一个函数，它用来创建一个自定义的tuple对象，并且规定了tuple元素的个数，并可以用属性而不仅仅是索引来引用tuple的某个元素。

>>> # Basic example
>>> from collections import namedtuple
>>> Point = namedtuple('Point', ['x', 'y'])
>>> p = Point(11, y=22)     # instantiate with positional or keyword arguments
>>> p[0] + p[1]             # indexable like the plain tuple (11, 22)
33
>>> x, y = p                # unpack like a regular tuple
>>> x, y
(11, 22)
>>> p.x + p.y               # fields also accessible by name
33
>>> p                       # readable __repr__ with a name=value style
Point(x=11, y=22)

namedtuple类的几种扩展方法：

方法	描述
somenamedtuple._make(iterable)	存在的序列或迭代实例创建一个新实例。
somenamedtuple._replace(**kwargs)	返回一个新的命名元组实例，并将指定域替换为新的值
somenamedtuple._asdict()	返回一个新的 dict ，它将字段名称映射到它们对应的值

Point = namedtuple('Point', ['x', 'y'])
t = [11, 2]
p = Point._make(t)     
print((p.x,p.y))
p = p._replace(x=33)     
print((p.x,p.y))
p_dict = p._asdict()     
print(p_dict)

#输出
(11, 2)
(33, 2)
{'x': 33, 'y': 2}

其他

#1.获取名字域的值的三种办法
print(p[0])
print(p.x)
print(getattr(p, 'x'))

#输出
33
33
33

#2.转换一个字典到命名元组，使用 ** 两星操作符
d = {'x': 11, 'y': 50}
p2 = Point(**d)
getattr(p2,'y')

#输出
50

Counter

class collections.Counter([iterable-or-mapping])

一个更简便的计数器，在NLP里面统计词频十分方便

from collections import Counter

c = Counter('gallahad')                 
print(c)
c = Counter({'red': 4, 'blue': 2})     
print(c)
c = Counter(cats=4, dogs=8)
print(c)

#输出

Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})
Counter({'red': 4, 'blue': 2})
Counter({'dogs': 8, 'cats': 4})

Counter对象有一个字典接口，如果引用的键没有任何记录，就返回一个0，而不是弹出一个 KeyError :

c = Counter(['eggs', 'ham'])
c['bacon']                              # count of a missing element is zero
#输出
0

计数器对象除了字典方法以外，还提供了几个其他的方法：

elements()
返回一个迭代器，其中每个元素将重复出现计数值所指定次。元素会按首次出现的顺序返回。如果一个元素的计数值小于一，elements() 将会忽略它。

c = Counter(a=4, b=2, c=0, d=-2)
sorted(c.elements())

输出： ['a', 'a', 'a', 'a', 'b', 'b']

most_common([n])
返回一个列表，其中包含 n 个最常见的元素及出现次数，按常见程度由高到低排序。如果 n 被省略或为 None，most_common() 将返回计数器中的所有元素。计数值相等的元素按首次出现的顺序排序：

Counter('abracadabra').most_common(3)

输出：[('a', 5), ('b', 2), ('r', 2)]

Counter 提供了几个数学操作，可以结合 Counter 对象，以生产 multisets (计数器中大于0的元素）。加和减，结合计数器，通过加上或者减去元素的相应计数。交集和并集返回相应计数的最小或最大值。每种操作都可以接受带符号的计数，但是输出会忽略掉结果为零或者小于零的计数。

c = Counter(a=3, b=1)
d = Counter(a=1, b=2)
c + d                       # add two counters together:  c[x] + d[x]
输出：Counter({'a': 4, 'b': 3})
c - d                       # subtract (keeping only positive counts)
输出：Counter({'a': 2})
c & d                       # intersection:  min(c[x], d[x]) 
输出：Counter({'a': 1, 'b': 1})
c | d                       # union:  max(c[x], d[x])
输出：Counter({'a': 3, 'b': 2})

deque

class collections.deque([iterable[, maxlen]])

list按索引访问元素很快，但是插入和删除元素很慢，deque是为了高效实现插入和删除操作的双向列表，适用于队列和栈。

方法	描述
append(x)	添加 x 到右端
appendleft(x)	添加 x 到左端
extend(iterable)	扩展deque的右侧，通过添加iterable参数中的元素
extendleft(iterable)	扩展deque的左侧，通过添加iterable参数中的元素。注意，左添加时，在结果中iterable参数中的顺序将被反过来添加。
pop()	移去并且返回一个元素，deque 最右侧的那一个。如果没有元素的话，就引发一个 IndexError。
popleft()	移去并且返回一个元素，deque 最左侧的那一个。如果没有元素的话，就引发 IndexError。
clear()	移除所有元素，使其长度为0.
copy()	创建一份浅拷贝
count(x)	计算 deque 中元素等于 x 的个数
index(x[, start[, stop]])	返回 x 在 deque 中的位置（在索引 start 之后，索引 stop 之前）。返回第一个匹配项，如果未找到则引发 ValueError。
insert(i, x)	在位置 i 插入 x 。如果插入会导致一个限长 deque 超出长度 maxlen 的话，就引发一个 IndexError。
remove(value)	移除找到的第一个 value。如果没有的话就引发 ValueError。
reverse()	将deque逆序排列。返回 None
rotate(n=1)	向右循环移动 n 步。如果 n 是负数，就向左循环。如果deque不是空的，向右循环移动一步就等价于 d.appendleft(d.pop()) ，向左循环一步就等价于 d.append(d.popleft())

defaultdict

class collections.defaultdict([default_factory[, …]])

使用dict时，如果引用的key不存在，就会抛出keyerror。如果希望key不存在时，返回一个默认值，就可以使用defaultdict。除了在key不存在时返回默认值，defaultdict的其他行为跟dict是完全一样的。

from collections import defaultdict
dd = defaultdict(lambda:'nan')
dd['key1'] = 'abc'
print(dd['key2'])
#输出
'nan'

#items为list
s1 = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d1 = defaultdict(list)
for k, v in s1:
    d1[k].append(v)
print(d1)
print(d1.keys())
print(d1.items())
print(d1['blue'])

#输出
defaultdict(<class 'list'>, {'yellow': [1, 3], 'blue': [2, 4], 'red': [1]})
dict_keys(['yellow', 'blue', 'red'])
dict_items([('yellow', [1, 3]), ('blue', [2, 4]), ('red', [1])])
[2, 4]

#计数功能
s2 = 'mississippi'
d2 = defaultdict(int)
for k in s2:
    d2[k] += 1
    
print(d2)
print(d2.keys())
print(d2.items())
print(d2['s'])

#输出
defaultdict(<class 'int'>, {'m': 1, 'i': 4, 's': 4, 'p': 2})
dict_keys(['m', 'i', 's', 'p'])
dict_items([('m', 1), ('i', 4), ('s', 4), ('p', 2)])
4

##items为set
s3 = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d3 = defaultdict(set)
for k, v in s3:
    d3[k].add(v)
    
print(d3)
print(d3.keys())
print(d3.items())
print(d3['gray'])

#输出
defaultdict(<class 'set'>, {'red': {1, 3}, 'blue': {2, 4}})
dict_keys(['red', 'blue'])
dict_items([('red', {1, 3}), ('blue', {2, 4})])
set()

OrderedDict

class collections.OrderedDict([items])

dict的key是无序的，通过OrderedDict的key会按照插入的顺序排序

from collections import OrderedDict
od = OrderedDict()
od['z'] = 3
od['a'] = 2
od['b'] = 1
print(od)

输出：OrderedDict([('z', 3), ('a', 2), ('b', 1)])

OrderedDict提供了**move_to_end(key, last=True)**方法：
将现有 key 移动到有序字典的任一端。如果 last 为真值（默认）则将元素移至末尾；如果 last 为假值则将元素移至开头。如果 key 不存在则会触发 KeyError:

>>> d = OrderedDict.fromkeys('abcde')
>>> d.move_to_end('b')
>>> ''.join(d.keys())
'acdeb'
>>> d.move_to_end('b', last=False)
>>> ''.join(d.keys())
'bacde'

OrderedDict对实现LRU结构提供很方便的构造方式，在leetcode中，就是希望我们不用OrderedDict来实现使用OrderedDict构造的LRU相同的功能：lc.146: LRU缓存机制

class LRU(OrderedDict):
    'Limit size, evicting the least recently looked-up key when full'

    def __init__(self, maxsize=128, /, *args, **kwds):
        self.maxsize = maxsize
        super().__init__(*args, **kwds)

    def __getitem__(self, key):
        value = super().__getitem__(key)
        self.move_to_end(key)
        return value

    def __setitem__(self, key, value):
        if key in self:
            self.move_to_end(key)
        super().__setitem__(key, value)
        if len(self) > self.maxsize:
            oldest = next(iter(self))
            del self[oldest]

贝壳er

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
python中collections模块的使用

官方API链接目录namedtupledefaultdictnamedtuplecollections.namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)namedtuple是一个函数，它用来创建一个自定义的tuple对象，并且规定了tuple元素的个数，并可以用属性而不仅仅是索引来引用tuple的某个元素。>>> # Basic example>>>
复制链接

扫一扫