Python 学习笔记_cecil python-CSDN博客

本文链接：https://blog.csdn.net/chensx1020/article/details/98745671

一、Python基础
- 1. 数据类型和变量
- 2. 字符串和编码
- 3. list 和 tuple
- - list
  - tuple
- 4. 条件判断
- 5. 循环
- 6. dict 和 set
- - dict
  - set
二、函数
- 1. 调用函数
- 2. 定义函数
- 3. 函数的参数
- 4. 递归函数
三、高级特性
- 1. 切片
- 2. 迭代
- 3. 列表生成式
- 4. 生成器
- 5. 迭代器
四、函数式编程
- 1. 高阶函数
- 2. 返回函数
- 3. 匿名函数
- 4. 装饰器
- 5. 偏函数
五、模块
六、面向对象编程
七、面向对象高级编程
八、错误、调试和测试
- 1. 错误处理
- 2. 调试
- 3. 单元测试
- 4. 文档测试
九、IO 编程
- 1. 文件读写
- 2. StringIO 和 BytesIO
- 3. 操作文件和目录
- 4. 序列化
十、进程和线程
- 1. 多进程
- 2. 多线程
- 3. ThreadLocal
- 4. 进程 vs. 线程
- 5. 分布式进程
十一、正则表达式
十二、常用内建模块
- 1. datetime
- 2. collections

一、Python基础

1. 数据类型和变量

整数
- //表示地板除，整数地板除整数结果还是整数，保留整数部分
- 没有大小限制
浮点数
- 没有大小限制，超出了一定范围就直接使用inf（无限大）表示
字符串
- 使用反斜杠\表示转义，如\\,\t,\n,\'
- 使用r''表示''内部的字符串不转义
- 使用'''...'''的格式表示多行
布尔值（True,False）
- and 与运算，or 或运算，not 非运算
空值（None）
变量
- 大小写字母、数字和_的组合，不能以数字开头
常亮
- 通常使用全部大写的字母表示

2. 字符串和编码

ASCII编码，由美国人发明，无法表示中文等字符
GB2312编码，中国制定的，用来把中文编码进去。每个国家都制定了自己的编码，就出现了乱码的情况
Unicode编码，所有语言都编码在里面。ASCII 编码是 1 个字节，而 Unicode 编码通常是 2 个字节，造成了浪费
UTF-8编码，UTF-8 编码把一个 Unicode 字符根据不同的数字大小编码成 1-6 个字节，常用的英文字母被编码成 1 个字节，汉字通常是 3 个字节，只有很生僻的字符才会被编码成 4-6 个字节
对于单个字符的编码，ord(char)函数获取字符的整数表示，chr(int)函数把编码转换为对应的字符

>>> ord('A')
65
>>> ord('中')
20013
>>> chr(66)
'B'
>>> chr(25991)
'文'

Python 对bytes类型的数据用带b前缀的单引号或双引号表示：x = b'ABC'
以 Unicode 表示的 str 通过encode(code)方法可以编码为指定(code)的bytes。
反过来，使用decode(code)，如果bytes中只有一小部分无效的字节，可以传入errors='ignore’忽略错误的字节

>>> b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')
'中'

len(str)获取字符串长度
格式化使用占位符（%d,%f,%s,%x(十六进制整数)）。如果要输出%，转义%%
另一种格式化字符串的方法是使用字符串的format()方法，它会用传入的参数依次替换字符串内的占位符{0}、{1}

>>> 'Hello, {0}, 成绩提升了 {1:.1f}%'.format('小明', 17.125)
'Hello, 小明, 成绩提升了 17.1%'

3. list 和 tuple

list

list是一种有序的集合，可以随时添加和删除其中的元素

>>> classmates = ['Michael', 'Bob', 'Tracy']
>>> classmates
['Michael', 'Bob', 'Tracy']

len(classmates)函数获取list元素的个数
使用从0开始的索引访问每个元素，超出范围，会报IndexError的错误
获取最后一个元素可以直接使用-1做索引，以此类推，倒数第二个-2，倒数第三个-3
使用append(str)追加元素，classmates.append('Adam')
使用insert(index, str)插入到指定index位置
使用pop()删除末尾元素，使用pop(index)删除索引为index的元素

tuple

元组。一旦初始化，就不能修改了，和list相似。classmates = ('Michael', 'Bob', 'Tracy')
没有append(),insert()方法，获取元素的方法同 list,但是不能再进行赋值修改
tuple 不可变，所以代码更安全。如果可能，能用 tuple 代替 list 就尽量用 tuple
如果要定义只有一个元素的 tulpe，加上逗号,和小括号区分开来，a = (1,)
可变元组

>>> t = ('a', 'b', ['A', 'B'])
>>> t[2][0] = 'X'
>>> t[2][1] = 'Y'
>>> t
('a', 'b', ['X', 'Y'])

4. 条件判断

if <条件判断1>:
    <执行1>
elif <条件判断2>:
    <执行2>
elif <条件判断3>:
    <执行3>
else:
    <执行4>

int(str)函数可以将字符串转成数字

5. 循环

for…in循环

names = ['Michael', 'Bob', 'Tracy']
for name in names:
    print(name)

range(int)函数生成从 0 到 int-1 的整数序列
list()函数转换为list

>>> list(range(5))
[0, 1, 2, 3, 4]

while循环

sum = 0
n = 99
while n > 0:
    sum = sum + n
    n = n - 2
print(sum)

break,continue

6. dict 和 set

dict

使用键-值存储的字典（dictionary）

>>> d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
>>> d['Michael']
95

使用in判断key是否存在，'Thomas' in d
通过dict提供的get(str, default)方法，如果key不存在，可以返回None，或者自己指定的value，d.get('Thomas', -1)
使用pop(key)删除指定指定键值对
key必须是不可变对象

set

set和dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key。

>>> s = set([1, 2, 2, 3])
>>> s
{1, 2, 3}

使用add(key)函数添加元素到set
remove(key)删除元素
set可以看成数学意义上的无序和无重复元素的集合，因此，两个set可以做数学意义上的交集、并集等操作

>>> s1 = set([1, 2, 3])
>>> s2 = set([2, 3, 4])
>>> s1 & s2
{2, 3}
>>> s1 | s2
{1, 2, 3, 4}

二、函数

1. 调用函数

内置函数 https://docs.python.org/zh-cn/3/library/functions.html
函数名其实就是指向一个函数对象的引用，完全可以把函数名赋给一个变量，相当于给这个函数起了一个“别名”：

>>> a = abs # 变量a指向abs函数
>>> a(-1) # 所以也可以通过a调用abs函数
1

2. 定义函数

定义一个函数要使用def语句，依次写出函数名、括号、括号中的参数和冒号:，然后，在缩进块中编写函数体，函数的返回值用return语句返回。

def my_abs(x):
    if x < 0:
        return -x
    else:
        return x

定义一个空函数可以使用pass语句（暂时还不知道怎么写函数，占位符，使代码能够正常运行），pass 也可以用在其他地方，比如 if
isinstance(param, (type1, type2))函数检查param的数据类型是否为type1或者type2
返回多个值

import math

def move(x, y, step, angle=0):
    nx = x + step * math.cos(angle)
    ny = y - step * math.sin(angle)
    return nx, ny

x, y = move(100, 100, 60, math.pi / 6)
print(x, y)
#151.96152422706632 70.0

#或者
r = move(100, 100, 60, math.pi / 6)
print(r)
#(151.96152422706632, 70.0)
#其实就是一个tuple

如果函数没有 return，会自动返回 None

3. 函数的参数

位置参数

类似于def f(x, y):这种

默认参数

类似于def f(x, y = 1):这种
必选参数在前，默认参数在后
调用时默认参数可以不按照顺序，把参数名加上即可。比如定义时def enroll(name, gender, age=6, city='Beijing'):，而调用时enroll('Adam', 'M', city='Tianjin')
默认参数必须指向不变对象

可变参数

传入的参数个数是可变的，可以是1个、2个到任意个，还可以是0个。使用一个*定义可变参数

def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum

>>> calc(1, 2)
5
>>> calc()
0

如果调用时传的参数是 list 或者 tuple，则可以使用以下形式

>>> nums = [1, 2, 3]
>>> calc(*nums)
14

*nums 表示把 nums 这个 list 的所有元素作为可变参数传进去

关键字参数

可变参数允许你传入0个或任意个参数，这些可变参数在函数调用时自动组装为一个 tuple。而关键字参数允许你传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个 dict。使用两个*定义关键字参数

def person(name, age, **kw):
    print('name:', name, 'age:', age, 'other:', kw)

>>> person('Michael', 30)
name: Michael age: 30 other: {}
>>> person('Bob', 35, city='Beijing')
name: Bob age: 35 other: {'city': 'Beijing'}
>>> person('Adam', 45, gender='M', job='Engineer')
name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}

如果有个 dict，则可以直接使用两个**进行调用

>>> extra = {'city': 'Beijing', 'job': 'Engineer'}
>>> person('Jack', 24, **extra)
name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'}

命名关键字参数

用来限制关键字参数的名字，只接受部分作为关键字参数

def person(name, age, *, city, job):
    print(name, age, city, job)

*后面的参数被视为命名关键字参数
如果函数定义中已经有了一个可变参数，后面跟着的命名关键字参数就不再需要一个特殊分隔符*了

def person(name, age, *args, city, job):
    print(name, age, args, city, job)

命名关键字参数可以有缺省值，从而简化调用

def person(name, age, *, city='Beijing', job):
    print(name, age, city, job)

参数组合

参数顺序：必选参数（位置参数）、默认参数、可变参数、命名关键字参数和关键字参数
对于任意函数，都可以通过类似func(*tuple, **dict)的形式调用它，无论它的参数是如何定义的

4. 递归函数

如果一个函数在内部调用自身本身，这个函数就是递归函数
函数调用是通过栈（stack）这种数据结构实现的，每当进入一个函数调用，栈就会加一层栈帧，每当函数返回，栈就会减一层栈帧。由于栈的大小不是无限的，所以，递归调用的次数过多，会导致栈溢出
尾递归是指，在函数返回的时候，调用自身本身，并且，return语句不能包含表达式

三、高级特性

1. 切片

取一个 list 或 tuple 的部分元素
L[0:3]表示，从索引 0 开始取，直到索引 3 为止，但不包括索引 3。即索引 0，1，2，正好是 3 个元素
如果第一个索引是 0，则可以省略
倒数第一个的索引为 -1，使用负数时表示倒数切片，同理 -1 可以省略
L[0:10:step]表示取出前十个元素中每隔 step 的元素
L[:]表示复制一个 L
字符串'xxx'也可以看成是一种 list，每个元素就是一个字符

2. 迭代

默认情况下，dict迭代的是key。如果要迭代value，可以用for value in d.values()，如果要同时迭代key和value，可以用for k, v in d.items()
字符串也可以进行迭代。for ch in 'ABC':
通过 collections 模块的 Iterable 类型可以判断是否为可迭代对象

>>> from collections import Iterable
>>> isinstance('abc', Iterable) # str是否可迭代
True
>>> isinstance([1,2,3], Iterable) # list是否可迭代
True
>>> isinstance(123, Iterable) # 整数是否可迭代
False

enumerate(list)函数可以把一个list变成索引-元素对，这样就可以在 for 循环中同时迭代索引和元素本身

>>> for i, value in enumerate(['A', 'B', 'C']):
...     print(i, value)
...
0 A
1 B
2 C

3. 列表生成式

用来创建 list 的生成式
要生成list[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]可以用list(range(1, 11))
[x * x for x in range(1, 11)]用来生成[1x1, 2x2, 3x3, ..., 10x10]，即[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
[要生成的元素 for 迭代元素 in 迭代对象 if 元素满足条件]
还可以使用两层循环，可以生成全排列：

>>> [m + n for m in 'ABC' for n in 'XYZ']
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']

4. 生成器

一边循环一边计算的机制，称为生成器：generator
只要把一个列表生成式的 [] 改成 ()，就创建了一个 generator:

>>> L = [x * x for x in range(10)]
>>> L
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> g = (x * x for x in range(10))
>>> g
<generator object <genexpr> at 0x1022ef630>

通过next(generator)函数 generator 的下一个返回值，或者也可以直接使用 for 循环进行迭代
如果一个函数定义中包含 yield 关键字，那么这个函数就不再是一个普通函数，而是一个 generator
函数是顺序执行，遇到 return 语句或者最后一行函数语句就返回。而变成 generator 的函数，在每次调用 next() 的时候执行，遇到 yield 语句返回，再次执行时从上次返回的 yield 语句处继续执行
用 for 循环调用 generator 时，拿不到 generator 的 return 语句的返回值。如果想要拿到返回值，必须捕获 StopIteration 错误，返回值包含在 StopIteration 的 value 中

5. 迭代器

可以被 next() 函数调用并不断返回下一个值的对象称为迭代器：Iterator。它们表示一个惰性计算的序列
生成器都是Iterator对象，但 list、dict、str 虽然是 Iterable，却不是 Iterator
把 list、dict、str 等 Iterable 变成 Iterator 可以使用 iter() 函数
凡是可作用于 for 循环的对象都是 Iterable 类型

四、函数式编程

1. 高阶函数

把函数作为参数传入，这样的函数称为高阶函数，函数式编程就是指这种高度抽象的编程范式

map/reduce

map(function,Iterable)，对序列的每个元素执行 function 函数
reduce 把一个函数作用在一个序列[x1, x2, x3, …]上，这个函数必须接收两个参数，reduce 把结果继续和序列的下一个元素做累积计算，比如：

reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)

filter

filter(function,Iterable)，对序列的每个元素执行 function 函数，只返回为 True 的元素

sorted

sorted(list)，从小到大排序
sorted(list， k=abs)，按照元素的绝对值从小到大排序，abs 是个函数
默认情况下，对字符串排序，是按照ASCII的大小比较的
对字符串忽略大小写进行排序。sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
反向排序。加上第三个参数reverse，sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)

2. 返回函数

A函数里面定义B函数，A函数最后 return B函数，调用A函数时返回函数，需要再次调用这个函数
返回函数不要引用任何循环变量，或者后续会发生变化的变量。（因为不是立即执行的）

3. 匿名函数

lambda x: x * x就是一个匿名函数，冒号前面的 x 表示函数参数

4. 装饰器

函数对象有一个__name__属性，可以拿到函数的名字
在代码运行期间动态增加功能的方式，称之为“装饰器”（Decorator）
@语法

5. 偏函数

用来修改固定函数参数的默认值，返回一个新的函数
functools.partial

五、模块

一个.py文件就成为一个模块（Module）
按目录来组织模块的方法称为包（Package），之后每个模块名之前都加上这个包名。package.module
每个包的目录下面都必须包含一个__init__.py文件，可以为空，也可以有代码，本身就是一个模块，模块名就是这个报名
通过在交互环境下执行import abc，可以检测系统是否已经存在 abc 模块
任何模块代码的第一个字符串都被视为模块的文档注释
__author__变量表示作者，__doc__也可以用来表示文档注释
sys模块的argv变量用来保存命令行的所有参数
命令行运行模块式，__name__变量被置为__main__
类似_xxx和__xxx这样的函数或变量就是非公开的（private），不应该被直接引用。是不应该，不是不能
安装第三方模块，是通过包管理工具pip完成的
Anaconda
搜索路径存在 sys 模块的 path 变量中
需要添加自己的搜索路径时，可以直接使用sys.path.append('')进行添加（运行时修改，运行结束失效）。也可以设置环境变量PYTHONPATH

六、面向对象编程

类型通常是大写开头的单词

class Student(object):
    pass

object表示继承的类

__init__函数在对象初始化的时候执行，第一个参数self表示本身
类中定义的函数第一个参数永远是实例变量self
__开头的变量为私有变量，只有内部才能访问（其实Python解释器把这个变量改成了_类名__变量名，所以其实可以通过_类名__变量名来访问这个变量，不同版本的解释器，名字可能不一样）
file-like objec鸭子类型，当某个方法需要某种类型的对象作为参数时，并不一定非要这种类型的对象才可以，只要这个对象有相应的方法就可以了（动态语言）
type()返回对应的类型
types 模块，types.FunctionType types.BuiltinFunctionType types.LambdaType types.GeneratorType
如果要获得一个对象的所有属性和方法，可以使用dir()函数，它返回一个包含字符串的 list。__xxx__属性或者方法在调用时除了使用'ABC.__xxx__()'还可以直接使用xxx('ABC')，自己写的类，也可以定义成__xxx__形式
hasattr(obj, 'x') # 有属性'x'吗 setattr(obj, 'y', 19) # 设置一个属性'y' getattr(obj, 'y', default) # 获取属性'y'
实例属性优先级高于类属性
使用del s.name删除实例 s 的 name 属性

七、面向对象高级编程

可以给实例绑定属性或者方法
__slots__变量限制实例添加的属性，对于继承的子类不起作用

 __slots__ = ('name', 'age') # 用tuple定义允许绑定的属性名称

@property装饰器获取属性值，@attr.setter设置属性值
多重继承，集成多个父类，从而拥有多个父类的所有方法。这种设计称为MixIn
__str__()方法，__repr__()方法
__iter__()方法返回一个迭代对象，使类可以使用for...in..循环
__getitem__()方法使像 list 那样，可以按照下标取出元素
__setitem__()方法，把对象视作 list 或 dict 来对集合赋值
__delitem__方法，用于删除某个元素
__getattr__()方法，动态返回一个属性
__call__()方法，对实例本身进行调用
Callable()判断一个对象能否被调用
枚举类Enum，@unique装饰器检查保证没有重复值
type()函数可以查看一个类型或变量的类型
type()函数既可以返回一个对象的类型，又可以创建出新的类型
metaclass元类允许你创建类或者修改类

八、错误、调试和测试

1. 错误处理

try...except...finally...，可以在except语句块后面加一个else表示当没有错误发生时执行
常见的错误和继承关系
logging模块的logging.exception(e)用来记录错误信息，但程序打印完错误信息后会继续执行，并正常退出
raise语句可以抛出一个错误实例

2. 调试

使用print()打印
assert 表达式, '错误信息'，表达式为False时，抛出AssertionError错误。启动时加上参数-O关闭 assert。python -O err.py
logging
Python 的调试器pdb
pdb.set_trace()

3. 单元测试

4. 文档测试

python 内置的 doctest 模块可以自动提取 ‘’‘xxx’’'注释中的代码并执行测试

九、IO 编程

1. 文件读写

open(文件, 模式, encoing, errors)打开一个文件
read()读取文件所有内容
close()关闭文件
with语句用法

with open('/path/to/file', 'r') as f:
    print(f.read())

read(size)每次读取 size 字节内容
readline()每次读取一行内容
readlines()一次性读取所有内容并按行返回 list
write()写文件
r读文件，rb读二进制文件，w写文件，wb写二进制文件，a追加

2. StringIO 和 BytesIO

先创建StringIO对象，然后write写内容，getvalue()获取写入后的 str
也可以

>>> from io import StringIO
>>> f = StringIO('Hello!\nHi!\nGoodbye!')
>>> while True:
...     s = f.readline()
...     if s == '':
...         break
...     print(s.strip())
...
Hello!
Hi!
Goodbye!

BytesIO和StringIO一样，只不过是前者操作二进制数据，后者操作 str

3. 操作文件和目录

os模块，os.name返回操作系统类型，os.environ操作系统的环境变量，os.environ.get('key')获取环境变量的值

# 查看当前目录的绝对路径:
>>> os.path.abspath('.')
'/Users/michael'
# 在某个目录下创建一个新目录，首先把新目录的完整路径表示出来:
# os.path.split(),拆分路径。os.path.split()，合并路径
>>> os.path.join('/Users/michael', 'testdir')
'/Users/michael/testdir'
# 然后创建一个目录:
>>> os.mkdir('/Users/michael/testdir')
# 删掉一个目录:
>>> os.rmdir('/Users/michael/testdir')

os.path.splitext()可以直接得到文件扩展名

>>> os.path.splitext('/path/to/file.txt')
('/path/to/file', '.txt')

# 对文件重命名:
>>> os.rename('test.txt', 'test.py')
# 删掉文件:
>>> os.remove('test.py')

复制函数可以使用shutil模块的copyfile()函数

# 列出当前目录下的所有目录
>>> [x for x in os.listdir('.') if os.path.isdir(x)]
['.lein', '.local', '.m2', '.npm', '.ssh', '.Trash', '.vim', 'Applications', 'Desktop', ...]

4. 序列化

变量从内存中变成可存储或传输的过程称之为序列化（pickling）
把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling
pickle模块的pickle.dumps(obj)方法把任意对象序列化成一个 bytes
pickle.dump(object, file)直接写入到一个 file-like Object
pickle.loads()反序列化对象，pickle.load(file)从 file-like Object 中反序列化
json模块
如果需要序列化一个对象，在对象中写一个方法 function，使用json.dumps(obj, default=function)即可。或者json.dumps(s, default=lambda obj: obj.__dict__)
反序列化时，同样加上object_hook函数即可。json.loads(json_str, object_hook=dict2student)
如果ensure_ascii为True(默认值)，则输出保证将所有输入的非ASCII字符转义。如果确保ensure_ascii为False，这些字符将原样输出

十、进程和线程

线程是最小的执行单元，而进城由至少一个线程组成

1. 多进程

fork()
multiprocessing模块

from multiprocessing import Process
import os

# 子进程要执行的代码
def run_proc(name):
    print('Run child process %s (%s)...' % (name, os.getpid()))

if __name__=='__main__':
    print('Parent process %s.' % os.getpid())
    p = Process(target=run_proc, args=('test',))
    print('Child process will start.')
    p.start()
    p.join()
    print('Child process end.')

执行结果

Parent process 928.
Process will start.
Run child process test (929)...
Process end.

Pool对象
subprocess模块创建子进程

2. 多线程

threading模块。current_thread()返回当前线程的实例
多进程变量各自拷贝一份，互不影响；多线程之间共享变量
通过threading.Lock()创建锁来解决多线程之间的共享变量问题

balance = 0
lock = threading.Lock()

def run_thread(n):
    for i in range(100000):
        # 先要获取锁:
        lock.acquire()
        try:
            # 放心地改吧:
            change_it(n)
        finally:
            # 改完了一定要释放锁:
            lock.release()

解释器的GIL全局锁导致即使100个线程跑在100核CPU上，也只能用到1个核

3. ThreadLocal

用一个全局 dict 存放所有的线程需要传递的参数，然后以 thread 自身作为 key 获得线程对应的参数

global_dict = {}

def std_thread(name):
    std = Student(name)
    # 把std放到全局变量global_dict中：
    global_dict[threading.current_thread()] = std
    do_task_1()
    do_task_2()

def do_task_1():
    # 不传入std，而是根据当前线程查找：
    std = global_dict[threading.current_thread()]
    ...

def do_task_2():
    # 任何函数都可以查找出当前线程的std变量：
    std = global_dict[threading.current_thread()]
    ...

ThreadLocal对象

4. 进程 vs. 线程

多任务，设计 Master-Worker 模式，Master 负责分配任务（一个），Worker 负责执行任务（多个）
多进程模式稳定性高，开销大（最早的Apache）
多线程任何一个线程挂掉都可能导致进程挂掉，效率比多进程高（IIS 服务器）
IIS 和 Apache 现在又有多进程+多线程的混合模式
线程切换（多进程或者多线程之间进行切换，也是需要耗时的，多任务一旦多了，就会消耗掉所有系统资源，什么事也做不了）
计算密集型和 IO 密集型
计算密集型需要消耗的 CPU 资源较多，计算密集型任务同时进行的数量应当等于 CPU 的核心数
Python 运行效率低，不适合做计算密集型的任务
IO 密集型任务越多，CPU 效率越高，99%的时间都花在 IO 上
异步 IO（Nginx 是支持异步 IO 的服务器）。事件驱动模型

5. 分布式进程

十一、正则表达式

re模块，re.match(r'正则表达式', str)方法进行匹配，成功返回一个 Match 对象，否则返回 None
re.split(r'正则表达式', str)切割字符串
使用()进行分组，在Match对象上使用group(0)方法，获取原始字符串，后面一次1,2…获取第1,2…个子串
默认是贪婪匹配，后面加一个?表示非贪婪匹配

>>> re.match(r'^(\d+?)(0*)$', '102300').groups()
('1023', '00')

如果一个正则表达式会多次去匹配，建议先预编译，后面就不会再进行正则表达式的编译了，而直接进行匹配

>>> import re
# 编译:
>>> re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')
# 使用：
>>> re_telephone.match('010-12345').groups()
('010', '12345')
>>> re_telephone.match('010-8086').groups()
('010', '8086')

十二、常用内建模块

1. datetime

处理日期和时间的标准库
datetime.now()获取当前的datetime，2015-05-18 16:28:07.198690
获取指定的时间

>>> from datetime import datetime
>>> dt = datetime(2015, 4, 19, 12, 20) # 用指定日期时间创建datetime
>>> print(dt)
2015-04-19 12:20:00

转换为时间戳，timestamp 是一个浮点数。如果有小数位，小数位表示毫秒数。

>>> from datetime import datetime
>>> dt = datetime(2015, 4, 19, 12, 20) # 用指定日期时间创建datetime
>>> dt.timestamp() # 把datetime转换为timestamp
1429417200.0

时间戳转换为 datetime

>>> from datetime import datetime
>>> t = 1429417200.0
>>> print(datetime.fromtimestamp(t))
2015-04-19 12:20:00

datetime.utcfromtimestamp(t)直接转换到 UTC 标准时区的时间
str 转换成 datetime

>>> from datetime import datetime
>>> cday = datetime.strptime('2015-6-1 18:19:59', '%Y-%m-%d %H:%M:%S')
>>> print(cday)
2015-06-01 18:19:59

datetime 转换为 str

>>> from datetime import datetime
>>> now = datetime.now()
>>> print(now.strftime('%a, %b %d %H:%M'))
Mon, May 05 16:28

对 datetime 进行 +，-运算符操作

>>> from datetime import datetime, timedelta
>>> now = datetime.now()
>>> now
datetime.datetime(2015, 5, 18, 16, 57, 3, 540997)
>>> now + timedelta(hours=10)
datetime.datetime(2015, 5, 19, 2, 57, 3, 540997)
>>> now - timedelta(days=1)
datetime.datetime(2015, 5, 17, 16, 57, 3, 540997)
>>> now + timedelta(days=2, hours=12)
datetime.datetime(2015, 5, 21, 4, 57, 3, 540997)