Effective Python（1）-CSDN博客

本文链接：https://blog.csdn.net/tlssnp/article/details/115594961

空白：

使用space来表示缩进，而不要用tab
和语法相关的每一层缩进都要用4个空格来表示
每行的字符数不应超过79
对于占据多行的长表达式来说，除了首行之外的其余各行都应该在通常的缩进级别之上再加4个空格
文件中的函数和类之间应该用两个空行隔开
在同一个类中，各方法之间应该用一个空行隔开
在使用下标来获取列表元素，调用函数或给关键字参数赋值的时候，不要在两旁添加空格
在为变量赋值的时候，赋值符号的左侧和右侧应该各自写上一个空格，而且只写一个就好。

命令

函数，变量和属性应该用小写字母来拼写，各单词之间以下划线相连，例如：lowercase_underscore
受保护的实例属性，应该以单个下划线开头，例如：_leading_underscore
私有的实例属性，应该以两个下划线开头，例如：__double_leading_underscore
类与异常，应该以每个单词首字母均大写的形式来命令，例如：CapitalizedWord
模块级别的常量，应该全部采用大写字母来拼写，各单词之间以下划线相连，例如：ALL_CAPS
类中的实例方法，应该把首个参数命令为self，以表示该对象自身
类方法的首个参数，应该命令为cls，以表示该类自身

表达式和语句

采用内联形式的否定词，而不要把否定词放在整个表达式的前面，例如：应该写if a is not b，而不是if not a is b
不要通过检测长度的方法（如if len(somelist) == 0）来判断somelist是否为[]或者""等空值，而是应该采用if not somelist 这种写法来判断，它会假定：空值将自动评估为False
检测somelist是否为[1]或’hi’等非空值时，也应如此，if somelist语句默认会把非空的值判断为True
不要编写单行的if语句，for循环，while循环及except复合语句，而是应该把这些语句分成多行来书写，以示清晰
import语句应该总是放在文件开头
引用模块的时候，总是应该使用绝对名称，而不应该根据当前模块的路径来使用相对名称。例如：引入bar包中的foo模块时，应该完整的写出from bar import foo，而不是简写为import foo
如果一定要以相对名称来编写import语句，那就采用明确的写法：from.import foo
文件中的那些import语句按顺序划分为三个部分，分别表示标准库模块，第三方模块以及自用模块。在每一部分中，各import语句应该按模块的字母顺序来排列。

了解bytes，str

bytes是八位二进制数，str是unicode字符，Unicode 转化为bytes使用encode，bytes转化为unicode使用decode。
操作文件对象时，默认以utf-8格式操作，所以传入的参数必须时str，可以使用‘wb’二进制写入模式，’rb‘模式读取文件。
str和bytes不能使用>或+一起混合操作。

用辅助函数来取代复杂的表达式

例如我们想取得url中的信息：

from urllib.parse import parse_qs

my_values = parse_qs('red=5&blue=0&green=',keep_blank_values=True)
#将url中的中文解码成字典
print(repr(my_values))
my_values.get()

这样确实可以取到，但是我们如果想要参数没有值的时候返回0的话，我们可以这样写：

red = my_values.get('red',default=[""])[0] or 0

如果我们想要用到计算：

red = int(my_values.get('red',default=[""])[0] or 0)

这样代码看起来会很冗长，我们应该改写：

red = my_values.get('red',[''])
red = int(red) if red[0] else 0

如果用的频繁，我们可以封装成函数：

def get_first_int(values, key, default = 0):
    found = values.get(key, [''])
    if found[0]:
        found = int(found[0])
    else:
        found = default
    return found

表达式如果变得比较复杂，那就考虑将其拆解成小块，并把这些逻辑移入辅助函数中。

了解切割序列的方法

切割列表时，即便start和end越界也不会出现问题。利用这一特性，我们可以限定输入序列的最大长度
反之，访问列表的某个元素时，索引不能越界，否则会导致异常。
对原列表进行切割时，会产生另外一份全新的列表。不会影响到原列表。
可以对切片赋值，会把原列表中处在相关范围内的值换成新值，即便长度不同。

在单次切片操作时，不要同时指定start，end和stride

Python中可以将以字节形式存储的字符串反转过来，即指定stride为-1

x = b'wodasdf'
y = x[::-1]
print(y)

这种技巧对字节串和ASCII字符有用，而对于utf-8的unicode字符没有用。

当stride为负值时，表示从末尾向前取值。
当三个值都指定时，会使代码难以阅读，尤其当stride为负值时，所以尽量使用步进式切割，但是这样会多产生一份拷贝，或者考虑内置itertools模块中的islice。

使用列表推导来取代map和filter
不要使用含有两个以上表达式的列表推导

如果需要使用，可以使用多个for循环。
列表推导也支持多个if条件，可以使用and连接，也可以使用多个if。
以下两个表达式等效

x = [x**2 for x in lists if x % 2 == 0 and x % 3 == 0]
x = [x**2 for x in lists if x % 2 == 0 if x % 3 == 0]

每个for循环也可以使用if条件

用生成器表达式来改写数据量较大的列表推导

列表推导输入数据较多时，如文件等操作，可能会消耗大量内存
生成器表达式是对列表推导和生成器的一种泛化。生成器表达式在运行的时候，并不会把整个输出序列都呈现出来，而是估值为迭代器，这个迭代器每次可以根据生成器表达式产生一项数据
把实现列表推导所用的那种写法放在一对圆括号里，就构成了生成器表达式。使用next每次返回下一个值。
迭代器可以用于另一个生成器表达式。

尽量用enumerate取代range

在一系列整数上面迭代时，内置的range函数很有用

from random import randint

random_bits = 0
for i in range(64):
    if randint(0,1):
        random_bits |= 1 << i       #a |= b 相当于 a = a|b 按位或  <<左移
        print(random_bits)

但是如果要同时获得列表的索引时，range有一点点麻烦，可以使用enumerate。

a = [0,1,2,3,4,5,6]
for x,a in enumerate(a):
    print(x,a)

第一个为索引，第二个为列表值，同时还可以指定开始计数时所用的值：

a = [0,1,2,3,4,5,6]
for x,a in enumerate(a,1):
    print(x,a)

用zip函数同时遍历两个迭代器

对于两个处于相同索引的值有关系时，可以使用其中一个列表的长度来执行，但是不易阅读。即便使用enumerate也比较繁琐
zip函数可以平行处理多个迭代器，然后将值汇聚成元组返回。

names = [1,2,3]
letters = [2,3,4]
for name, count in zip(names, letters):
    print(name, count)

但是如果输入的迭代器长度不同，只要有一个耗尽，zip就提前停止。

不要在for和while循环中后面写else块

if/else中，如果不执行前面那个if块，那就执行else块。
try/except中，如果前面try块没有成功执行，那就执行except块。
try/except/else中，如果前面try没有失败，则执行else块。
try/finally中，无论try成没成功，总是执行finally
for/else中，如果循环完整执行，则执行else，如果用break跳出，则不执行else。

合理利用try/except/else/finally结构中的每个代码块

无论try块是否异常，都可利用try/finally复合语句中的finally块来执行清理工作（如文件的关闭）
else 块可以用来缩减try块中的代码量，并把没有发生异常时所要执行的语句与try/except代码块隔开
顺利运行try块后，若想使某些能在finally块的清理代码之前执行，则可将这些操作写到else中。