13.collections模块的使用

最新推荐文章于 2024-10-02 00:27:17 发布

chixinsha2740

最新推荐文章于 2024-10-02 00:27:17 发布

阅读量84

点赞数

文章标签：数据库 c/c++ python

原文链接：https://my.oschina.net/u/3836952/blog/1836463

版权

第一章： namedtuple的功能详解

为了便于理解nametuple,先来讲讲tuple的一些特性

1. 可拆包


mytuple1 = ('cannon', 26, 178)
name1, age, height = mytuple1
name2, *other = mytuple1

print(name1, age, height)
print(name2, other)   # other会是list

运行结果

cannon 26 178
cannon [26, 178]

2.tuple的不可变性不是绝对的

mytuple2 = ('tuple', [1, 2])
mytuple2[1].append(3)
print(mytuple2)    # 通常不建议在tuple中放 可变对象

运行结果

('tuple', [1, 2, 3])   # dict元素中加入了3

3. tuple比list好的地方：
因为immutable(不可变性) ，所以

1. 性能优化  
2. 线程安全 
3. 可以作为dict的key 
4. 拆包特性

第三点可以作为dict的key很重要，代码讲解一下：

mydict = {}
mydict[mytuple1] = 'value'
# mydict[mytuple2] = 'value'   # tuple中有可变的元素，就不能作为dict的key了， 因为不能哈希
print(mydict)

运行结果:

{('cannon', 26, 178): 'value'} 
#tuple作为了dict的key， 但如果tuple中有可变元素如list，就无法作为dict的key， 因为不能哈希

namedtuple讲解

namedtuple是tuple的子类, 特别在数据处理中用得很多
namedtuple类似创建类一样创建tuple，速度快效率高

from collections import namedtuple
User = namedtuple('User', ['name', 'age', 'height'])  
# User相当于数据库的表名， []中的是数据名


# 传入数据法一
user1 = User(name='cannon1', age=25, height=178)
print(user1.age, user1.name, user1.height)

# 传入数据法二
tuple = ('cannon2', 26, 180)   # 用list代替tuple传入也可以
user2 = User(*tuple)     # 类似函数参数 *args   或者用user2 = User._make(tuple)
print(user2.age, user2.name, user2.height)

# namedtuple转为OrderedDict
user_info_dict = user2._asdict()
print(user_info_dict)

# namedtuple依然可以拆包
name, *other = user2
print(name, other)

运行结果:

25 cannon1 178
26 cannon2 180
OrderedDict([('name', 'cannon2'), ('age', 26), ('height', 180)])
cannon2 [26, 180]

第二章：defaultdict的功能详解

以统计list中的元素个数为例子讲解default的用法

先以dict方法实现：

from collections import defaultdict     # c语言实现的，性能高

# 统计数量
# dict方法
users = ['cannon1', 'cannon2', 'cannon1', 'cannon1']
user_dict1 = {}
for user in users:
    if user not in user_dict1:   # 这种逻辑过多的话，会影响代码可读性
        user_dict1[user] = 1
    else:
        user_dict1[user] += 1

print(user_dict1)

# dict方法改良  setdefault， 效率比原方法高效， 应为少了一次查询
user_dict2 = {}
for user in users:
    user_dict2.setdefault(user, 0)  # 对应key设置默认的value
    user_dict2[user] += 1

print(user_dict2)

运行结果:

{'cannon1': 3, 'cannon2': 1}
{'cannon1': 3, 'cannon2': 1}

defaultdict方法实现:

# defaultdict方法
default_dict = defaultdict(int)  # 传入默认类型  list，float等等都以传， 但不可以传入参数

for user in users:
    default_dict[user] += 1

print(default_dict)

运行结果:

defaultdict(<class 'int'>, {'cannon1': 3, 'cannon2': 1})

当传入默认类型的方法不适合或者想传入实际数值作为参数时，我们可以利用函数作用传入类型：

# 假如默认类型是dict的话，可以这么做。  
def gen_dict():
    return {
        'name': 'cannon3',
        'age': 25
    }


default_dict2 = defaultdict(gen_dict)
print(default_dict2['default'])  # print未定义过的dict的key

运行结果:

{'name': 'cannon3', 'age': 25}

第三章：deque功能详解

deque是双端队列，我们以代码来讲解

from collections import deque


user_list = ['cannon1', 'cannon2']
user_name = user_list.pop()
print(user_name, user_list)

运行结果：

cannon2 ['cannon1']

list只有pop溢出尾部元素，如果想溢出头部元素，就需要deque了
deque是对list的扩充，使用c编写的。我们可以通过查看源码：

可以发现deque多了appendleft,extendleft,popleft 等可以作用于头部的方法。
一些简单用法举例

from collections import deque


# user_list = ['cannon1', 'cannon2']
# user_name = user_list.pop()
# print(user_name, user_list)

# appendleft
user_deque = deque(['cannon1', 'cannon2', 'cannon3'])
user_deque.appendleft(('cannon0'))   # 头部加入cannon0
print(user_deque)

# 浅拷贝copy
user_deque2 = user_deque.copy()

# 深拷贝
import copy
user_deque3 = copy.deeepcopy(user_deque)

# extend  在原queue中扩容
user_deque11 = deque(['cannon11', 'cannon22', 'cannon33'])
user_deque11.extend(user_deque)   # user_deque11会扩容

# reverse 原deque中 元素顺序颠倒
user_deque.reverse()

最后另外说明：

deque的应用：   from queue import Queue  双端队列
deque对比list： deque是GIL线程安全的， list不是线程安全的

第四章： Counter功能详解

Counter用来统计可迭代类型中的相同元素个数
统计列表中每种元素个数：

>>> from collections import Counter

>>> users = ['cannon1', 'cannon2', 'cannon3', 'cannon2', 'cannon2', 'cannon1']
>>> user_counter = Counter(users)     # 传入可迭代对象, 完成统计功能
>>> print(user_counter)


Counter({'cannon2': 3, 'cannon1': 2, 'cannon3': 1})

统计字符串

# 统计字符串
>>> user_counter = Counter('asadjansjjsjjdjddwsssa')
>>> print(user_counter)
Counter({'s': 6, 'j': 6, 'a': 4, 'd': 4, 'n': 1, 'w': 1})

进行合并统计

# 进行合并的统计, 可以update可迭代对象， 也可以update  Counter对象
>>> user_counter.update('sajdhwawhwwiwiwiwhhdh')    # 合并统计字符串
>>> print(user_counter)

Counter({'w': 8, 's': 7, 'j': 7, 'a': 6, 'd': 6, 'h': 5, 'i': 3, 'n': 1})


>>> user_counter2 = Counter('bsd')
>>> user_counter2.update(user_counter)    # 合并统计Counter对象
>>> print(user_counter2)

Counter({'s': 8, 'w': 8, 'd': 7, 'j': 7, 'a': 6, 'h': 5, 'i': 3, 'b': 1, 'n': 1})

统计数目最多的前几个

# 统计top n 的问题
>>> print(user_counter.most_common(2))  # 统计数量最多的两种

[('w', 8), ('s', 7)]

第五章：OrderedDict功能详解

OrderedDict继承了dict, 是有序的dict。

python2 dict是无序的
python3 dict是有序的

OrderedDict除了是有序的以外，还有很多dict没有的方法：

>>> from collections import OrderedDict

>>> user_dict = OrderedDict()
>>> user_dict['b'] = 'cannon2'
>>> user_dict['a'] = 'cannon1'
>>> user_dict['c'] = 'cannon3'
>>> user_dict['e'] = 'cannon3'
>>> user_dict['d'] = 'cannon3'
>>> print(user_dict)   # 会按添加顺序排列
OrderedDict([('b', 'cannon2'), ('a', 'cannon1'), ('c', 'cannon3'), ('e', 'cannon3'), ('d', 'cannon3')])


# popitem
>>> print(user_dict.popitem())   # p移出尾端元素
('d', 'cannon3')
>>> print(user_dict)
OrderedDict([('b', 'cannon2'), ('a', 'cannon1'), ('c', 'cannon3'), ('e', 'cannon3')])


#pop
>>> print(user_dict.pop('a'))    # 必须传入key
cannon1
>>> print(user_dict)
OrderedDict([('b', 'cannon2'), ('c', 'cannon3'), ('e', 'cannon3')])


# move_to_end
>>> user_dict.move_to_end('b')  # b对应的元素移至末尾
>>> print(user_dict)
OrderedDict([('c', 'cannon3'), ('e', 'cannon3'), ('b', 'cannon2')])

第六章：ChainMap功能详解

ChainMap可以将迭代类型连接起来遍历
通过代码讲解：

>>> from collections import ChainMap

# ChainMap 列表
>>> a = [1, 2, 3]
>>> b = [3, 4, 5]
>>> newlist = ChainMap(a, b)
>>> print(newlist)


# ChainMap字典
>>> user_dict1 = {'a': 'cannon1', 'b': 'cannon2'}
>>> user_dict2 = {'c': 'cannon3', 'd': 'cannon4'}

>>> new_dict = ChainMap(user_dict1, user_dict2)
>>> print(new_dict['c'])   # 用起来就像一个dict
cannon3

# 动态的加入新的字典
>>> new_dict = new_dict.new_child({'aa': 'aa', 'bb': 'bb'})  

>>> for key, value in new_dict.items():
>>>     print(key, value)
d cannon4
a cannon1
c cannon3
bb bb
aa aa
b cannon2

#maps属性, 得到所有数据
>>> print(new_dict.maps)
[{'aa': 'aa', 'bb': 'bb'}, {'a': 'cannon1', 'b': 'cannon2'}, {'c': 'cannon3', 'd': 'cannon4'}]

>>> new_dict.maps[0]['a'] = '0000000'   # 说明ChainMap 只是方便遍历多个dict， 并没有产生新的对象

>>> print(new_dict)
ChainMap({'aa': 'aa', 'bb': 'bb', 'a': '0000000'}, {'a': 'cannon1', 'b': 'cannon2'}, {'c': 'cannon3', 'd': 'cannon4'})

ChainMap补充：

ChainMap 只是方便遍历多个dict， 并没有产生新的对象
ChainMap 中假设有 多个字典存在相同的key， 则遍历到一个key后，不会再去遍历同样的key了

转载于:https://my.oschina.net/u/3836952/blog/1836463

chixinsha2740

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

13.collections模块的使用

第一章： namedtuple的功能详解

为了便于理解nametuple,先来讲讲tuple的一些特性

1. 可拆包

2.tuple的不可变性不是绝对的

3. tuple比list好的地方： 因为immutable(不可变性) ，所以

namedtuple讲解

第二章：defaultdict的功能详解

第三章：deque功能详解

第四章： Counter功能详解

第五章：OrderedDict功能详解

第六章：ChainMap功能详解

3. tuple比list好的地方：
因为immutable(不可变性) ，所以