1、namedtuple
collections.namedtuple 是一个工厂函数,用以构建只有少数属性但是没有方法的对象,也可以用来构建一个带字段名的元组和一个有名字的类。
Card = collections.namedtuple('Card', ['rank', 'suit'])
beer_card = Card('7', 'diamonds')
beer_card 结果输出
Card(rank='7', suit='diamonds')
也可访问单个属性
beer_card .rank 结果输出
'7'
❶ 创建一个具名元组需要两个参数,一个是类名,另一个是类的各个字段的名字。后者
可以是由数个字符串组成的可迭代对象,或者是由空格分隔开的字段名组成的字符串。
❷ 存放在对应字段里的数据要以一串参数的形式传入到构造函数中(注意,元组的构造
函数却只接受单一的可迭代对象)。
❸ 你可以通过字段名或者位置来获取一个字段的信息。
2、python内置序列类型
-
容器序列
list、tuple 和 collections.deque 这些序列能存放不同类型的数据。
容器序列存放的是它们所包含的任意类型的对象的引用
-
扁平序列
str、bytes、bytearray、memoryview 和 array.array,这类序列只能容纳一种类型。
扁平序列里存放的是值而不是引用。换句话说,扁平序列其实是一段连续的内存空间。由此可见扁平序列其实更加紧
凑,但是它里面只能存放诸如字符、字节和数值这种基础类型。 -
可变序列
list、bytearray、array.array、collections.deque 和 memoryview。 -
不可变序列
tuple、str 和 bytes。
3、列表推导式
symbols = '$¢£¥€¤'
codes = [ord(symbol) for symbol in symbols]
codes 结果输出
[36, 162, 163, 165, 8364, 164]
通常的原则是,只用列表推导来创建新的列表,并且尽量保持简短。
如果列表推导的代码超过了两行,你可能就要考虑是不是得用 for 循环重写了。
4、filter和map
symbols = '$¢£¥€¤'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127]
beyond_ascii 结果输出
[162, 163, 165, 8364, 164]
beyond_ascii = list(filter(lambda c: c > 127, map(ord, symbols)))
beyond_ascii 结果输出
[162, 163, 165, 8364, 164]
5、笛卡尔积
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
tshirts = [(color, size) for color in colors for size in sizes] ➊
tshirts
结果输出
[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'),
('white', 'M'), ('white', 'L')]
6、元组
有些 Python 入门教程把元组称为“不可变列表”,然而这并没有完全概括元组的特点。除
了用作不可变的列表,它还可以用于没有字段名的记录(数量和位置信息也很重要)。
元组拆包
lax_coordinates = (33.9425, -118.408056)
latitude, longitude = lax_coordinates # 元组拆包
latitude 结果输出
33.9425
longitude 结果输出
-118.408056
*使用 args 来获取不确定数量的参数
a, b, *rest = range(5)
a, b, rest 结果输出
(0, 1, [2, 3, 4])
a, b, *rest = range(3)
a, b, rest 结果输出
(0, 1, [2])
a, b, *rest = range(2)
a, b, rest 结果输出
(0, 1, [])
7、bisect 模块
-
用bisect搜索(二分查找)
import bisect a = [1, 4, 6, 8, 12, 15, 20] position = bisect.bisect(a, 13) print(position)
-
按索引插入
# 用可变序列内置的insert方法插入
a.insert(position, 13)
print(a)
-
用bisect.insort插入新元素
bisect.insort(my_list, new_item)
8、内存视图
memoryview 是一个内置类,它能让用户在不复制内容的情况下操作同一个数组的不同切片。
numbers = array.array('h', [-2, -1, 0, 1, 2])
memv = memoryview(numbers) ➊
len(memv) 结果输出
5
memv[0] ➋ 结果输出
-2
9、NumPy和SciPy库
NumPy 实现了多维同质数组(homogeneous array)和矩阵,这些数据结构不但能处理数字,还能存放其他由用户定义的记录。
例如以下的二维数组行列操作。
import numpy ➊
a = numpy.arange(12) ➋
a
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
type(a)
<class 'numpy.ndarray'>
a.shape ➌
(12,)
a.shape = 3, 4 ➍
a
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
SciPy 是基于 NumPy 的另一个库,它提供了很多跟科学计算有关的算法,专为线性代数、数值积分和统计学而设计。
10、双向队列
collections.deque 类(双向队列)是一个线程安全、可以快速从两端添加或者删除元素的数据类型。而且如果想要有一种数据类型来存放“最近用到的几个元素”,deque 也是一个很好的选择。
11、编码和解码
s = 'café'
len(s) # 输出结果
4
b = s.encode('utf8')
# 编码
b # 输出结果
b'caf\xc3\xa9'
b.decode('utf8') #解码
b # 输出结果
'café
可以把字节序列想成晦涩难懂的机器磁芯转储,把 Unicode 字符串想成“人类可读”的文本。那么,把字节序列变成人类可读的文本字符串就是解码,而把字符串变成用于存储或传输的字节序列就是编码。