(一)functools:管理函数的工具
import functools
'''
functools模块提供了一些工具来管理或扩展和其他callable对象,从而不必完全重写
'''
1.修饰符
from functools import partial
'''
functools模块提供的主要工具就是partial类,可以用来包装一个有默认参数的callable对象。
得到的对象本身就是callable,可以把它看作是原来的参数。
'''
# 举个栗子
def foo(name, age, gender):
print(name, age, gender)
p = partial(foo, "mashiro", 16)
p("female") # mashiro 16 female
'''
可以看到p相当于是已经绑定了name和age的foo函数,name我们在传参的时候只需要传入一个gender就可以了
这个函数的源码实现比较复杂,但是如果以简单的装饰器的方式实现就很清晰了
'''
def my_partial(f, name, age):
def inner(gender):
return f(name, age, gender)
return inner
p = my_partial(foo, "satori", 16)
p("female") # satori 16 female
'''
可以看到,当我调用my_partial(foo, "satori", 16)的时候,返回了inner函数
此时的p相当于是inner,当我再调用p("female")的时候,等价于调用inner("female")
然后将两次传入的参数,按照顺序组合起来传递给foo函数,如果不限制参数的话就是:
def my_partial(f, *args1, **kwargs1):
def inner(*args2, **kwargs2):
from collections import ChainMap
args = args1 + args2
kwargs = dict(ChainMap(kwargs1, kwargs2))
return f(*args, **kwargs)
return inner
所以一定要和原函数的参数顺序保持一致,如果我传入p = my_partial("mashiro", 16),此时"mashiro"会传给name,16传给age
我再调用p(name="xxx")的话,肯定会报错的
'''
from functools import partial
import functools
'''
默认情况下,partial对象没有__name__属性的,如果没有这些属性,那么被修饰的函数会很难调试。
'''
def foo():
# fucking
pass
print(foo.__name__) # foo
p = partial(foo)
try:
print(p.__name__)
except AttributeError as e:
print(e) # 'functools.partial' object has no attribute '__name__'
# 那么如何添加呢?首先增加到包装器的属性在WRAPPER_ASSIGNMENTS中定义,另外WRAPPER_UPDATES列出了要修改的值
print("assign:", functools.WRAPPER_ASSIGNMENTS) # assign: ('__module__', '__name__', '__qualname__', '__doc__', '__annotations__')
print("update:", functools.WRAPPER_UPDATES) # update: ('__dict__',)
# 添加,表示从原函数将属性赋值或增加到partial对象
functools.update_wrapper(p, foo)
print(p.__name__) # foo
from functools import partial
'''
可以把partial看成是一个简单的装饰器,装饰器不仅可以装饰函数,还可以装饰类,只要是callable对象,说白了只要是能加上()的都可以
这就是Python的魅力,非常的动态。比如列表进行extend, 其实不仅仅可以extend一个列表,还可以是元组,甚至是字典,只要是iterable对象都可以。
'''
class A:
def __init__(self, name, age, gender):
self.name = name
self.age = age
self.gender = gender
def print_info(self):
print(f"name: {self.name}, age: {self.age}, gender: {self.gender}")
p = partial(A, "mashiro", 16)
a = p("female") # 这两步等价于 a = A("mashiro", 16, "female")
a.print_info() # name: mashiro, age: 16, gender: female
from functools import partial, partialmethod
'''
partial返回一个可以直接使用的callable,partialmethod返回的callable则可以用做对象的非绑定方法
'''
# 举个例子
def standalone(self):
print(f"self = {self}")
class A:
method1 = partial(standalone)
method2 = partialmethod(standalone)
a = A()
try:
a.method1()
except TypeError as e:
# 由于standalone需要一个参数self,我们这里没有传,因此报错
print(e) # standalone() missing 1 required positional argument: 'self'
# 但是我们调用method2呢?
a.method2() # self = <__main__.A object at 0x0000000002964588>
'''
得到了一个A的实例对象。
所以,partial在哪里调用时没有区别的,必须手动显示地传递,该是几个就是几个。
但是在类中如果使用partialmethod定义的话,那么在使用实例(a)调用的话,会自动将实例传进去。
'''
from functools import wraps
'''
我们在知道在使用装饰器装饰完函数的时候,属性会变。比如:
'''
def deco(func):
def inner(*args, **kwargs):
return func(*args, **kwargs)
return inner
@deco
def foo():
pass
# 函数从下到下执行,加上@deco等价于,foo = deco(foo) = inner,也就是说此时的foo不再是foo了,已经是inner了
print(foo.__name__) # inner
# 那么如何在装饰的时候,还保证原来函数的信息呢
def deco(func):
@wraps(func) # 只需要加上这一个装饰器即可,会自动对所修饰的函数应用update_wrapper
def inner(*args, **kwargs):
return func(*args, **kwargs)
return inner
@deco
def bar():
pass
# 可以看到原来函数的信息并没有改变
print(bar.__name__) # bar
2.比较
import functools
'''
在Python2中,类可以一个__cmp__()方法,它会根据这个对象小于、等于、或者大于所比较的元素而分别返回-1、0、1.
Python2.1中引入了富比较(rich comparision)的方法。
如:__lt__(),__gt__(),__le__(),__eq__(),__ne__(),__gt__()和__ge__(),可以完成一个比较操作并返回一个bool值。
Python3已经废弃了__cmp__()方法。
另外,functools提供了一些工具,从而能更容易地编写符合新要求的类,即符合Python3中新的比较需求。
'''
@functools.total_ordering
class A:
def __init__(self, val):
self.val = val
def __eq__(self, other):
return self.val == other.val
def __gt__(self, other):
return self.val > other.val
a1 = A(1)
a2 = A(2)
print(a1 < a2)
'''
这个类必须提供__eq__()和另外一个富比较方法的实现,这个修饰符会自动增加其余的方法。
'''
import functools
'''
由于Python3废弃了老式的比较函数,sort()之类的函数中也不再支持cmp参数。
对于使用了比较函数的较老的程序,可以使用cmp_to_key()将比较函数转换为一个比对键的函数,这个键用于确定元素在最终序列中的位置
'''
def compare_obj(a, b):
if a < b:
return -1
elif a > b:
return 1
else:
return 0
l = [1, 5, 2, 11, 2, 44, 54, 5, 1]
print(sorted(l, key=functools.cmp_to_key(compare_obj))) # [1, 1, 2, 2, 5, 5, 11, 44, 54]
3.缓存
import functools
'''
lru_cache()修饰符将一个函数包装在一个"最近最少使用的"缓存中。函数的参数用来建立一个散列键,然后映射到这个结果。
后续调用如果有相同的参数,就会从这个缓存中获取值而不会再次调用这个函数。
这个修饰符还会为函数增加方法来检查缓存的状态(cache_info)和清空缓存(cache_clear)
'''
@functools.lru_cache() # 里面可以执行参数maxsize,默认是128
def foo(a, b):
print(f"foo({a} * {b})")
return a * b
print("第一次调用")
for i in range(2):
for j in range(2):
foo(i, j)
print(foo.cache_info())
print("\n第二次调用")
for i in range(3):
for j in range(3):
foo(i, j)
print(foo.cache_info())
print("清除缓存")
foo.cache_clear()
print(foo.cache_info())
print("\n第三次调用")
for i in range(2):
for j in range(2):
foo(i, j)
print(foo.cache_info())
'''
第一次调用
foo(0 * 0)
foo(0 * 1)
foo(1 * 0)
foo(1 * 1)
CacheInfo(hits=0, misses=4, maxsize=128, currsize=4)
第二次调用
foo(0 * 2)
foo(1 * 2)
foo(2 * 0)
foo(2 * 1)
foo(2 * 2)
CacheInfo(hits=4, misses=9, maxsize=128, currsize=9)
清除缓存
CacheInfo(hits=0, misses=0, maxsize=128, currsize=0)
第三次调用
foo(0 * 0)
foo(0 * 1)
foo(1 * 0)
foo(1 * 1)
CacheInfo(hits=0, misses=4, maxsize=128, currsize=4)
'''
# 我们观察一下第二次调用,3 * 3应该是9次,为什么只有5次,因为第一次调用有4次执行过了,放到缓存里,因此不需要执行了
4.reduce
import functools
'''
reduce这个函数无需介绍,在Python2中是内置的,但是在Python3中被移到functools下面
'''
l = range(100)
print(functools.reduce(lambda x, y: x+y, l)) # 4950
print(functools.reduce(lambda x, y: x+y, l, 10)) # 4960
print(functools.reduce(lambda x, y: x+y, l, 100)) # 5050
l = [1, 2, 3, 4, 5]
print(functools.reduce(lambda x, y: x*y, l)) # 120
5.泛型函数
import functools
'''
在类似Python的动态类型语言中,通常需要基于参数的类型完成稍有不同的操作,特别是在处理元素列表与单个元素的差别时。
直接检查参数的类型固然很简单,但是有些情况下,行为差异可能被隔离到单个的函数中。
对于这些情况,functools提供了singledispatch修饰符来注册一组泛型函数,可以根据函数第一个参数的类型自动切换
'''
@functools.singledispatch
def myfunc(arg):
print(f"default myfunc {arg}")
@myfunc.register(int)
def myfunc1(arg):
print(f"myfunc1 {arg}")
@myfunc.register(list)
def myfunc2(arg):
print(f"myfunc2 {arg}")
myfunc("string") # default myfunc string
myfunc(123) # myfunc1 123
myfunc(["1", "2"]) # myfunc2 ['1', '2']
'''
可以看到使用signledispatch包装的是默认实现,在未指定其他类型特定函数的时候就用这个默认实现。
然后使用包装的函数这里是myfunc,通过register(数据类型)进行注册,根据所传参数的类型,从而执行对应的函数
'''
(二)itertools:迭代器函数
1.合并和分解迭代器
import itertools
'''
chain函数可以接收多个可迭代对象(或者迭代器)作为参数,最后返回一个迭代器。
它会生成所有输入迭代器的内容,就好像这些内容来自一个迭代器一样。
类似于collections下的ChainMap,可以合并多个字典。chain可以合并多个可迭代对象
'''
c = itertools.chain([1, 2, 3], "abc", {"k1": "v1", "k2": "v2"})
print(c) # <itertools.chain object at 0x00000000029745F8>
for i in c:
print(i, end=" ") # 1 2 3 a b c k1 k2
print()
# 还可以使用chain.from_iterable,参数接收多个可迭代对象组成的一个可迭代对象
c = itertools.chain.from_iterable([[1, 2, 3], "abc", {"k1": "v1", "k2": "v2"}])
for i in c:
print(i, end=" ") # 1 2 3 a b c k1 k2
# 函数zip则是把多个迭代器对象组合到一个元组中
name = ["古明地觉", "椎名真白", "雪之下雪乃"]
where = ["东方地灵殿", "樱花张的宠物女孩", "春物"]
z = zip(name, where)
print("\n", z) # <zip object at 0x0000000001DC03C8>
print(list(z)) # [('古明地觉', '东方地灵殿'), ('椎名真白', '樱花张的宠物女孩'), ('雪之下雪乃', '春物')]
# zip英文意思是拉链,很形象,就是把对应元素给组合起来
# 但如果两者长度不一致怎么办?
name = ["古明地觉", "椎名真白", "雪之下雪乃", "xxx"]
where = ["东方地灵殿", "樱花张的宠物女孩", "春物"]
print(list(zip(name, where))) # [('古明地觉', '东方地灵殿'), ('椎名真白', '樱花张的宠物女孩'), ('雪之下雪乃', '春物')]
# 可以看到,不一致的时候,当一方结束之后就停止匹配。
# 如果想匹配长的,那么可以使用zip_longest,这个函数不像zip一样是内置的,它在itertools下面
print(list(itertools.zip_longest(name, where))) # [('古明地觉', '东方地灵殿'), ('椎名真白', '樱花张的宠物女孩'), ('雪之下雪乃', '春物'), ('xxx', None)]
# 可以看到没有的默认赋值为None了,当然我们也可以指定填充字符
print(list(itertools.zip_longest(name, where, fillvalue="你输入的是啥啊")))
# [('古明地觉', '东方地灵殿'), ('椎名真白', '樱花张的宠物女孩'), ('雪之下雪乃', '春物'), ('xxx', '你输入的是啥啊')]
# isslice返回一个迭代器,按照索引从迭代器返回所选择的元素
num = range(20)
# 从index=5的地方选到index=10(不包含)的地方
s = itertools.islice(num, 5, 10)
print(list(s)) # [5, 6, 7, 8, 9]
# 从开头选到index=5的地方
s = itertools.islice(num, 5)
print(list(s)) # [0, 1, 2, 3, 4]
# 从index=5的地方选择到index=15的地方,步长为3
s = itertools.islice(num, 5, 15, 3)
print(list(s)) # [5, 8, 11, 14]
'''
所以除了迭代器之外,
如果只传一个参数,比如5,表示从index=0选到index=5(不包含)的地方
如果传两个参数,比如5和10,表示从index=5选到index=10(不包含)的地方
如果传三个参数,比如5和10和2,表示从index=5选到index=10(不包含)的地方,步长为2
'''
# 那么支不支持负数索引呢?答案是不支持的,因为不知道迭代器有多长,除非全部读取,可是那样的话干嘛不直接转化为列表之后再用[:]这种形式呢?
# 之所以使用isslice这种形式,就是为了在不全部读取的情况下,也能选择出我们想要的部分,所以这种方式只支持从前往后,不能从后往前读。
# tee()函数根据一个原输入迭代器返回多个独立、和原迭代器一模一样的迭代器(默认为两个)
r = [1, 2, 3, 4, 5]
i1, i2 = itertools.tee(r)
print(list(i1)) # [1, 2, 3, 4, 5]
print(list(i2)) # [1, 2, 3, 4, 5]
2.转换输入
import itertools
'''
内置的map()函数返回一个迭代器,它对输入迭代器中的值调用一个函数并返回结果。
输入迭代中的元素全部被消费时,map()函数就会停止
'''
l = [1, 2, 3]
map_l = map(lambda x: str(x)+"a", l)
print(list(map_l)) # ['1a', '2a', '3a']
l1 = [(0, 5), (1, 6), (2, 7)]
'''
注意map里面的函数只能有一个参数,因此不可以写成以下格式
map_l1 = map(lambda x, y: x*y, l1)
但是可以这样
'''
map_l1 = map(lambda x: x[0]*x[1], l1)
print(list(map_l1)) # [0, 6, 14]
# 但是itertools下的startmap()是支持的
l2 = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
# 注意里面的函数的参数的参数个数是由我们后面传入对象决定的,这里每个元组显然有三个元素,所以需要三个参数
map_l1 = itertools.starmap(lambda x, y, z: f"{x} + {y} + {z} = {x+y+z}", l2)
print(list(map_l1)) # ['1 + 2 + 3 = 6', '4 + 5 + 6 = 15', '7 + 8 + 9 = 24']
# map的话只能通过lambda x: x[0], x[1], x[2]这样的形式
# starmap只能对类似于[(), (), ()]这种值进行处理,比如[1, 2, 3]使用starmap是会报错的,但是[(1, ), (2, ), (3, )]不会报错
3.生成新值
import itertools
'''
count(start=0, step=1)函数返回一个迭代器,该迭代器能够无限地生成连续的整数。
接收两个参数:起始(默认为0)和步长(默认为1)
等价于:
def count(firstval=0, step=1):
x = firstval
while 1:
yield x
x += step
'''
'''
cycle(iterable)返回一个迭代器,会无限重复里面的内容,直到内存耗尽
'''
c2 = itertools.cycle("abc")
print(list(itertools.islice(c2, 0, 10))) # ['a', 'b', 'c', 'a', 'b', 'c', 'a', 'b', 'c', 'a']
'''
repeat(obj, times=None),无限重复obj,除非指定times。
'''
print(list(itertools.repeat("abc", 3))) # ['abc', 'abc', 'abc']
4.过滤
import itertools
l = [1, 2, 3, 4, 5]
drop_l = itertools.dropwhile(lambda x: x < 3, l)
print(list(drop_l)) # [3, 4, 5]
take_l = itertools.takewhile(lambda x: x < 3, l)
print(list(take_l)) # [1, 2]
filter_l = filter(lambda x: x < 3, l)
print(list(filter_l)) # [1, 2]
filterfalse_l = itertools.filterfalse(lambda x: x < 3, l)
print(list(filterfalse_l)) # [3, 4, 5]
'''
filter和takewhile一样,过滤出条件为True的值
filterfalse和dropwhile一样,过滤出条件为False的值
'''
# compress则提供了另一种过滤可迭代对象内容的方法。
# 举个栗子
condition = [True, False, True, True, False]
data = [1, 2, 3, 4, 5]
print(list(itertools.compress(data, condition))) # [1, 3, 4]
# 或者
condition = [1, 0, "x", "x", {}]
print(list(itertools.compress(data, condition))) # [1, 3, 4]
5.合并输入
import itertools
'''
accumulate函数处理输入迭代器,得到一个类似于斐波那契的结果
'''
print(list(itertools.accumulate(range(5)))) # [0, 1, 3, 6, 10]
print(list(itertools.accumulate("abcde"))) # ["a", "ab", "abc", "abcd", "abcde"]
# 所以这里的相加还要看具体的含义
try:
print(list(itertools.accumulate([[1, 2], (3, 4)])))
except TypeError as e:
print(e) # can only concatenate list (not "tuple") to list
# 这里就显示无法将列表和元组相加
# 当然也可以自定义
data = [1, 2, 3, 4, 5]
method = lambda x, y: x*y
print(list(itertools.accumulate(data, method))) # [1, 2, 6, 24, 120]
# 可以看到这里的结果就改变了
'''
product则是会将多个可迭代对象组合成一个笛卡尔积
'''
print(list(itertools.product([1, 2, 3], [2, 3]))) # [(1, 2), (1, 3), (2, 2), (2, 3), (3, 2), (3, 3)]
'''
permutations函数从输入迭代器生成元素,这些元素以给定长度的排列形成组合。默认会生成所以排列的全集
'''
data = [1, 2, 3, 4]
print(list(itertools.permutations(data)))
'''
[(1, 2, 3, 4), (1, 2, 4, 3), (1, 3, 2, 4), (1, 3, 4, 2), (1, 4, 2, 3), (1, 4, 3, 2),
(2, 1, 3, 4), (2, 1, 4, 3), (2, 3, 1, 4), (2, 3, 4, 1), (2, 4, 1, 3), (2, 4, 3, 1),
(3, 1, 2, 4), (3, 1, 4, 2), (3, 2, 1, 4), (3, 2, 4, 1), (3, 4, 1, 2), (3, 4, 2, 1),
(4, 1, 2, 3), (4, 1, 3, 2), (4, 2, 1, 3), (4, 2, 3, 1), (4, 3, 1, 2), (4, 3, 2, 1)]
'''
print(list(itertools.permutations(data, 2)))
# [(1, 2), (1, 3), (1, 4), (2, 1), (2, 3), (2, 4), (3, 1), (3, 2), (3, 4), (4, 1), (4, 2), (4, 3)]
# permutations只要顺序不同就看做一种结果,combinations则保证只要元素相同就是同一种结果
data = "abcd"
print(list(itertools.combinations(data, 3))) # [('a', 'b', 'c'), ('a', 'b', 'd'), ('a', 'c', 'd'), ('b', 'c', 'd')]
# 尽管combinations不会重复单个的输入元素,但是有时候可能也需要考虑包含重复元素的组合。
# 对于这种情况,可以使用combination_with_replacement
print(list(itertools.combinations_with_replacement(data, 3)))
'''
[('a', 'a', 'a'), ('a', 'a', 'b'), ('a', 'a', 'c'), ('a', 'a', 'd'), ('a', 'b', 'b'),
('a', 'b', 'c'), ('a', 'b', 'd'), ('a', 'c', 'c'), ('a', 'c', 'd'), ('a', 'd', 'd'),
('b', 'b', 'b'), ('b', 'b', 'c'), ('b', 'b', 'd'), ('b', 'c', 'c'), ('b', 'c', 'd'),
('b', 'd', 'd'), ('c', 'c', 'c'), ('c', 'c', 'd'), ('c', 'd', 'd'), ('d', 'd', 'd')]
'''
(三)operator:内置操作符的函数接口
import operator
'''
使用迭代器编程时,有时需要为简单的表达式创建小函数。
operator模块提供了一些函数,可以对应标准API中内置的算术、比较和其他操作。
注意:operator中提供的操作,都可以通过lambda函数实现,就我个人而言更喜欢lambda函数
'''
1.逻辑操作
import operator
'''
有些函数可以用来确定一个值得相应布尔值,将其取反以创建相反的布尔值,以及比较对象以查看它们是否相等
'''
a = -1 # 为真
b = 5 # 为真
# not为关键字,所以是not_,判断值是否为假。由于a=-1为真,不为假,所以是False
print(operator.not_(a)) # False
# truth,判断值是否为真
print(operator.truth(b)) # True
# is_, 等价于a is b
print(operator.is_(a, b)) # False
# is_not,等价于a is not b
print(operator.is_not(a, b)) # True
2.比较操作符
import operator
'''
支持所有的富比较操作符
'''
a = -1
b = 5
for func in ("lt", "le", "gt", "ge", "eq", "ne"): # <, <=, >, >=, ==, !=
print(f"{func}(a, b): {getattr(operator, func)(a, b)}")
'''
lt(a, b): True
le(a, b): True
gt(a, b): False
ge(a, b): False
eq(a, b): False
ne(a, b): True
'''
3.算术操作符
import operator
'''
支持处理数字值的算术操作符
'''
a = -1
b = 5.0
c = 2
d = 6
print("abs(a): ", operator.abs(a))
print("neg(a): ", operator.neg(a))
print("neg(b): ", operator.neg(b))
print("pos(a): ", operator.pos(a))
print("pos(b): ", operator.pos(b))
print("add(a, b): ", operator.add(a, b))
print("floordiv(a, b): ", operator.floordiv(a, b))
print("floordiv(a, c): ", operator.floordiv(a, c))
print("mod(a, b): ", operator.mod(a, b))
print("mul(a, b): ", operator.mul(a, b))
print("pow(c, d): ", operator.pow(c, d))
print("sub(b, a): ", operator.sub(b, a))
print("truediv(a, b): ", operator.truediv(a, b))
print("truediv(d, c): ", operator.truediv(d, c))
print("and_(c, d): ", operator.and_(c, d))
print("invert(c): ", operator.invert(c))
print("lshift(c, d): ", operator.lshift(c, d))
print("or_(c, d): ", operator.or_(c, d))
print("rshift(d, c): ", operator.rshift(d, c))
print("xor(c, d): ", operator.xor(c, d))
'''
a = -1
b = 5.0
c = 2
d = 6
abs(a): 1
neg(a): 1
neg(b): -5.0
pos(a): -1
pos(b): 5.0
add(a, b): 4.0
floordiv(a, b): -1.0
floordiv(a, c): -1
mod(a, b): 4.0
mul(a, b): -5.0
pow(c, d): 64
sub(b, a): 6.0
truediv(a, b): -0.2
truediv(d, c): 3.0
and_(c, d): 2
invert(c): -3
lshift(c, d): 128
or_(c, d): 6
rshift(d, c): 1
xor(c, d): 4
'''
4.序列操作符
import operator
'''
处理序列的操作符可以分为四组:建立序列,搜索元素,访问内容,以及从序列删除元素
'''
a = [1, 2, 3]
b = ['a', 'b', 'c']
print("a =", a)
print("b =", b)
print("concat(a, b): ", operator.concat(a, b))
print("contains(a, 1): ", operator.contains(a, 1))
print("contains(b, 'd'): ", operator.contains(b, 'd'))
print("countOf(a, 1): ", operator.countOf(a, 1))
print("countOf(b, 'd'): ", operator.countOf(b, 'd'))
print("indexOf(a, 5): ", operator.indexOf(a, 1))
print("getitem(b, 1): ", operator.getitem(b, 1))
print("getitem(b slice(1, 3): ", operator.getitem(b, slice(1, 3)))
print("setitem(b, 1, 'd'): ", end=' ')
operator.setitem(b, 1, 'd')
print(b)
print("setitem(a, slice(1, 3), [4, 5]): ", end=' ')
operator.setitem(a, slice(1, 3), [4, 5])
print(a)
print("delitem(b, 1)", end=' ')
operator.delitem(b, 1)
print(b)
print("delitem(a, slice(1, 3): ", end=' ')
operator.delitem(b, slice(1, 3))
print(a)
# 其中的一些操作(setitem()和delitem())会原地修改序列,返回的是None
'''
a = [1, 2, 3]
b = ['a', 'b', 'c']
concat(a, b): [1, 2, 3, 'a', 'b', 'c']
contains(a, 1): True
contains(b, 'd'): False
countOf(a, 1): 1
countOf(b, 'd'): 0
indexOf(a, 5): 0
getitem(b, 1): b
getitem(b slice(1, 3): ['b', 'c']
setitem(b, 1, 'd'): ['a', 'd', 'c']
setitem(a, slice(1, 3), [4, 5]): [1, 4, 5]
delitem(b, 1) ['a', 'c']
delitem(a, slice(1, 3): [1, 4, 5]
'''
# 个人觉得这些都没有什么乱用,可以直接实现的,没必要使用这个库
5.原地操作符
略
6.排序
import operator
'''
这一节书上没有,是我自己加的。个人觉得这个库只有在这一方面会有用。
'''
l = [
[1, 3],
[7, 4],
[6, 2],
[3, 5]
]
# 现在我要将这个列表进行排序,怎么排呢?里面里面列表的第一个元素的顺序从小到大排
# 也就是说,排完序之后应该是这样的, [[1, 3], [3, 5], [6, 2], [7, 4]]
l.sort(key=operator.itemgetter(0))
# 按照key来排序,itemgetter(0),表示获取各自索引为0的元素,进行比较
print(l) # [[1, 3], [3, 5], [6, 2], [7, 4]]
# 但是我们可以使用lambda函数来实现,而且还可以实现更加复杂的效果
l1 = [
[1, 3],
[7, 4],
[6, 2],
[3, 5]
]
l1.sort(key=lambda x: x[0])
print(l1) # [[1, 3], [3, 5], [6, 2], [7, 4]]
l2 = [-3, -5, 3, -9, 8, 2]
# 对l2我想这样排序,首先按照正负数排序,负数排左边,正数排右边。
# 然后按照绝对值得大小排, 绝对值大的排左边,小的排右边
# 也就是说排完之后应该是这样的,[-9, -5, -3, 8, 3, 2]
l2.sort(key=lambda x: (x > 0, ~abs(x)))
print(l2) # [-9, -5, -3, 8, 3, 2]
# 因此可以看到这个x代表的就是序列里面的元素
# 如果是字典的话,那么x就是字典里面的key
d = {"a": 4, "c": 3, "b": 2}
# 可是字典没有sort,我们如何验证呢?
import heapq
# 按照value选择两个最大的
# 参数:选择几个,从哪里选择,按照什么规则去选择
print(heapq.nlargest(2, d, key=lambda x: d[x])) # ['a', 'c']
'''
个人总结一下哈,我个人觉得这个库是真的没有什么用,完全可以使用其他的方法代替,而且更容易理解。
当然也可能是我能力不够,这个库的更高级的用法我没有看到(雾)
'''
(四)contextlib:上下文管理器工具
import contextlib
'''
contextlib模块包含的工具用于处理上下文管理器和with语句
'''
1.上下文管理器API
import contextlib
'''
上下文管理器(context manager)负责管理一个代码块中的资源,会在进入代码块时创建资源,然后再退出代码后清理这个资源。
比如:文件就支持上下文管理器API,可以确保文件读写后关闭文件。
with open("xxx") as f:
f.read()
'''
# 那么这是如何实现的呢?我们可以手动模拟一下
class Open:
def __init__(self, filename, mode='r', encoding=None):
self.filename = filename
self.mode = mode
self.encoding = encoding
def __enter__(self):
print("__enter__,有了这个就可以使用with Open() as xx语句,这里的xx就是我return的内容")
return self
def read(self):
print(f"文件进行读操作,读取文件:{self.filename}, 模式:{self.mode}, 编码:{self.encoding}")
def __exit__(self, exc_type, exc_val, exc_tb):
print("__exit__,我是用来清理资源的,当操作执行完毕之后就会执行我,比如:关闭文件")
with Open("1.xxx") as f:
f.read()
'''
__enter__,有了这个就可以使用with Open() as xx语句,这里的xx就是我return的内容
文件进行读操作,读取文件:1.xxx, 模式:r, 编码:None
__exit__,我是用来清理资源的,当操作执行完毕之后就会执行我,比如:关闭文件
'''
import contextlib
# 相较于try:finally语法,结合上下文管理器和with语句是一种更加紧凑的写法,因为__exit__这个方法总是会被调用的,即使产生了异常
class Open:
def __init__(self, filename, mode='r', encoding=None):
self.filename = filename
self.mode = mode
self.encoding = encoding
def __enter__(self):
return 123
def __exit__(self, exc_type, exc_val, exc_tb):
# 注意到这里有三个参数,使用pycharm的时候,会很智能地自动帮我们加上去
print(exc_type)
print(exc_val)
print(exc_tb)
return True
with Open("1.xx") as f:
print(f)
'''
123
None
None
None
'''
with Open("1.xx") as f:
print(f)
1 / 0
print(123)
print(456)
print(789)
print("你猜我会被执行吗?")
'''
123
<class 'ZeroDivisionError'>
division by zero
<traceback object at 0x0000000009EDD848>
你猜我会被执行吗?
'''
'''
可以看到当我们程序没有出错的时候,打印的值全为None。一旦with语句里面出现了异常,那么会立即执行__exit__函数。
里面的参数就是:异常的类型,异常的值,异常的信息栈。
因此:当with语句结束之后会调用__exit__函数,如果with语句里面出现了错误则会立即调用__exit__函数。
但是__exit__函数返回了个True是什么意思呢?
当with语句里面出现了异常,理论上是会报错的,但是由于要执行__exit__函数,所以相当于暂时把异常塞进了嘴里。
如果__exit__函数最后返回了一个布尔类型为True的值,那么会把塞进嘴里的异常吞下去,程序不报错正常执行。如果返回布尔类型为False的值,会在执行完__exit__函数之后再把异常吐出来,引发程序崩溃。
这里我们返回了True,因此程序正常执行,最后一句话被打印了出来。
但是1/0这句代码后面的几个print却没有打印,为什么呢?
因为上下文管理执行是有顺序的,
with Open("1.xxx") as f:
code1
code2
先执行Open函数的__init__函数,再执行__enter__函数,把其返回值给交给f,然后执行with语句里面的代码,最后执行__exit__函数。
只要__exit__函数执行结束,那么这个with语句就算结束了。
而with语句里面如果有异常会立即进入__exit__函数,因此异常语句后面的代码是无论如何都不会被执行的。
'''
2.上下文管理器作为函数修饰符
import contextlib
'''
类ContextDecorator增加了对常规上下文管理器类的支持,因此不仅可以作为上下文管理器,也可以作为函数修饰符
'''
class Context(contextlib.ContextDecorator):
def __init__(self, how_used):
self.how_used = how_used
print(f"__init__({self.how_used})")
def __enter__(self):
print(f"__enter__({self.how_used})")
return self
def __exit__(self, exc_type, exc_val, exc_tb):
print(f"__exit__({self.how_used})")
# 一旦继承了ContextDecorator这个类,那么便可以作为装饰器去装饰。
# 说白了Context("as decorator")返回了Context的一个实例对象,理论上是不可调用的,但是父类实现了call方法。
# 因此如果我们自己实现了一个定义了__call__方法的类,让Context去继承,也是可以达到类似的效果
@Context("as decorator")
def func(message):
print(message)
'''
__init__(as decorator)
'''
# 当我执行执行func的时候,此时的func已经不再是原来的那个func了
# func = self(func),从而调用Context的__call__方法,可是Context没有这个方法,那么它的父类肯定有。
# 我们看看contextlib.ContextDecorator的源码,去掉了注释
'''
class ContextDecorator(object):
def _recreate_cm(self):
return self
def __call__(self, func):
@wraps(func)
def inner(*args, **kwds):
with self._recreate_cm():
return func(*args, **kwds)
return inner
可以看到首先@Context("as decorator")会执行Context的__init__方法,打印__init__(as decorator),得到实例对象self
此时等价于@self, -->func = self(func),执行__call__方法,-->func = inner
当执行inner的时候,会先调用__enter__方法,然后执行inner,最后执行__exit__方法
'''
func("doing work i the wrapped function")
# 这个无需解释
with Context("as contetx manager"):
print("doing work in the context")
'''
__init__(as contetx manager)
__enter__(as contetx manager)
doing work in the context
__exit__(as contetx manager)
'''
3.从生成器到上下文管理器
import contextlib
'''
采用传统方式创建上下文管理器并不难,只需要包含一个__enter__方法和一个__exit__方法的类即可。
不过某些时候,如果只有很少的上下文需要管理,那么完整地写出所以代码便会成为额外的负担。
在这些情况下,可以使用contextmanager修饰符将一个生成器函数转换为上下文管理器。
代码结构:
@contextlib.contextmanager
def foo():
print(123)
yield 456
print(789)
with foo() as f:
print(f)
123
456
789
只要给函数加上这个装饰器,那么便可以使用with as 语句。
当中的yield相当于将代码块分隔为两个战场,yield上面的代码相当于__exter__会先执行,然后将yield的值交给f,然后执行yield下面的代码块
'''
@contextlib.contextmanager
def bar(name, age):
print(f"name is {name}, age is {age}")
yield list
print("我是一匹狼,却变成了狗")
with bar("mashiro", 16) as b:
print(b("abcde"))
'''
name is mashiro, age is 16
['a', 'b', 'c', 'd', 'e']
我是一匹狼,却变成了狗
'''
# 先执行yield上面的内容,然后yield list,那么b = list,最后执行yield下面的内容
# contextmanager返回的上下文管理器排成子ContextDecorator,所以也可以被用作函数修饰符
@bar("satori", 16)
def foo():
print("猜猜我会在什么地方输出")
foo()
'''
name is satori, age is 16
猜猜我会在什么地方输出
我是一匹狼,却变成了狗
'''
# bar中含有yield,肯定是一个生成器,所以直接@bar("satori", 16)是不会输出的。当我执行foo的时候,还会先执行bar里面yield上面的内容,
# 然后执行foo代码的内容,最后执行yield下面的内容
4.关闭打开的句柄
import contextlib
'''
file类直接支持上下文管理器API,但另外一些表示打开句柄的对象却并不支持。
为了确保关闭句柄,要是用closing为它创建一个上下文管理器
'''
class Door:
def __init__(self):
print("__init__()")
self.status = "open"
def close(self):
print("close()")
self.status = "closed"
with contextlib.closing(Door()) as door:
print(f"{door.status}")
# 先不急看结果,先来分析一下。首先contextlib.closing本身就是一个上下文管理器
'''
class closing(AbstractContextManager):
def __init__(self, thing):
self.thing = thing
def __enter__(self):
return self.thing
def __exit__(self, *exc_info):
self.thing.close()
'''
# 可以看到当我with contextlib.closing(Door()) as door的时候,直接将Door的实例对象传入了closing这个类中
# 然后enter返回了self.thing也就是我们传进去的Door的实例对象,__enter__返回self.thing交给door
# 然后执行我们的逻辑,最后__exit__函数再调用self.thing.close函数,所以我们定义的类中一定要实现close函数
# 执行结果
'''
__init__()
open
close()
'''
# 先执行__init__函数,再执行我们自己的逻辑,打印"open",最后执行close函数,将状态改为"closed"。
# 怎么证明这一点呢?
print(door.status) # closed
# 如果出现了异常怎么办呢?不用怕,依旧会执行close语句.
# 由于contextlib.closing的__exit__函数并没有返回布尔类型为True的值,所以最后还是会抛出异常,我们手动捕获一下
try:
with contextlib.closing(Door()) as boy_next_door:
print(123)
1/0
print(456)
except Exception:
pass
print(boy_next_door.status)
'''
__init__()
123
close()
closed
'''
# 最后还是打印了"closed",所以还是执行了close()方法
5.忽略异常
import contextlib
'''
很多情况下,忽略库产生的异常很有用,因为这个错误可能会显示期望的状态已经被实现,否则该错误就可以被忽略。
要忽略异常,最常用的办法就是利用一个try except语句。
但是在我们此刻的主题中,try except也可以被替换成contextlib.suppress(),以更显示地抑制with块中产生的异常
'''
def foo():
print(123)
1 / 0
print(456)
with contextlib.suppress(ZeroDivisionError):
foo()
print(789)
'''
123
'''
# 最终只输出了123,可以看到不仅1/0中下面的456没有被打印,连foo()下面的789也没有被打印
# 可以传入多个异常
with contextlib.suppress(ZeroDivisionError, BaseException, Exception):
foo()
'''
123
'''
# 出现异常之后,会将异常全部丢弃
6.重定向到输出流
import contextlib
import io
import sys
'''
设计不当的代码可能会直接写sys.stdout或sys.stderr,而没有提供参数来配置不同的输出目标。
可以用redirect_stdout和redirect_stderr上下文管理器从这些函数中捕获输出,因为无法修改这个函数的源代码来接收新的输出参数
'''
def func(a):
sys.stdout.write(f"stdout :{a}")
sys.stderr.write(f"stderr :{a}")
capture = io.StringIO()
'''
我们执行func本来是要往sys.stdout和sys.stderr里面写的
但这是在with语句contextlib.redirect_stdout(capture), contextlib.redirect_stderr(capture)下面,
因此可以理解往sys.stdout和sys.stderr里面写的内容就被捕获到了,然后会将捕获到的内容输入到capture里面,因为我们指定了capture
'''
with contextlib.redirect_stdout(capture), contextlib.redirect_stderr(capture):
func("蛤蛤蛤蛤")
print(capture.getvalue()) # stdout :蛤蛤蛤蛤stderr :蛤蛤蛤蛤
'''
redirect_stdout和redirect_stderr会修改全局状态,替换sys模块中的对象,可以想象gevent里面的patch_all会将Python里面socket,ssl等都换掉。
因此要使用这两个函数,必须要注意。这些函数并不保证线程安全,所以在多线程应用中调用这些函数可能会有不确定的结果。
如果有其他希望标准输出流关联到终端设备,那么redirect_stdout和redirect_stderr将会干扰和影响那些操作。
'''
7.动态上下文管理器栈
import contextlib
'''
大多数上下文管理器都一次处理一个对象,如单个文件或数据库句柄。
在这些情况下,对象是提前已知的,并且使用上下文管理器的代码可以建立这一对象上。
另外一些情况下,程序可能需要在一个上下文中创建未知数目的对象,控制流退出这个上下文时所有这些对象都要清理,ExitStack就是用来处理这些更动态的情况。
ExitStack实例会维护清理回调的一个栈数据结构,这些回调显示地填充在上下文中,在控制流退出上下文时会以逆序调用所有注册的回调。
结果类似于有多个嵌套的with语句,只不过它们是动态建立的。
'''
# 可以使用多种方法填充ExitStack,比如
@contextlib.contextmanager
def make_context(i):
print(f"{i}: entering")
yield {}
print(f"{i}: exiting")
def variable_stack(n, msg):
with contextlib.ExitStack() as stack:
for i in range(n):
stack.enter_context(make_context(i))
print(msg)
variable_stack(2, "inside stack")
'''
contextlib.ExitStack()相当于创建了上下文管理器栈
stack.enter_context将上下文管理器放入到栈中,注意此时已经执行了
会先输出:
0: entering
1: entering
等于是把yield之后的结果压入栈中
然后执行后面的代码,所以会打印出msg
当里面的代码执行完毕之后,会继续执行栈里面的数据,但是栈是后入先出的。i=1后入栈,所以先执行
随意最后输出:
1: exiting
0: exiting
'''
# 输出结果
''''
0: entering
1: entering
inside stack
1: exiting
0: exiting
'''