时间复杂度
1. 字典与列表
Python 字典中使用了 hash table,因此查找操作的复杂度为 O(1),而 list 实际是个数组,在 list 中,查找需要遍历整个 list,其复杂度为 O(n),因此对成员的查找访问等操作字典要比 list 更快。
2. 集合与列表
set 的 union, intersection,difference 操作要比 list 的迭代要快。因此如果涉及到求 list 交集,并集或者差的问题可以转换为 set 来操作。
3.循环
对循环的优化所遵循的原则是尽量减少循环过程中的计算量,有多重循环的尽量将内层的计算提到上一层。
4.字符串
python 中的字符串对象是不可改变的,因此对任何字符串的操作如拼接,修改等都将产生一个新的字符串对象,而不是基于原字符串,因此这种持续的 copy 会在一定程度上影响 python 的性能。
- 在字符串连接的使用尽量使用 join() 而不是 +;
- 当对字符串可以使用正则表达式或者内置函数来处理的时候,选择内置函数;
- 对字符进行格式化比直接串联读取要快,因此要使用:
out = "<html>%s%s%s%s</html>" % (head, prologue, query, tail)
避免
out = "<html>" + head + prologue + query + tail + "</html>"
5.列表
列表解析要比在循环中重新构建一个新的 list 更为高效
for w in list:
total.append(w)
列表解析:
total = [w for w in list]
6.其他
- 如果需要交换两个变量的值使用 a,b=b,a 而不是借助中间变量 t=a;a=b;b=t;
- 使用级联比较 “x < y < z” 而不是 “x < y and y < z”;
- while 1 要比 while True 更快(当然后者的可读性更好);
- build in 函数通常较快,add(a,b) 要优于 a+b。
列表
排序:sort()、sorted()
1. 列表排序后的索引
arr = [1,2,3,0,1,9,8]
sorted(range(len(arr)), key=lambda k: arr[k])
[3, 0, 4, 1, 2, 6, 5]
2. 两个维度均降序(优先第一个维度)
arr=[[0,0],[1,0],[1,1],[0,1]]
arr.sort(key=lambda x:[-x[0],-x[1]])
arr
[[0,0],[0,1],[1,0],[1,1]]
字符串计算:eval()
1. 利用虚数求解一元一次方程
eq='2*X+1=3'
equ=eq.replace('=','-(')+')'
c=eval(equ,{'X':1j})
if c.imag==0:
print(-1)
else:
x=-c.real/c.imag
print(c)
1
进制转换
- 十进制
→
\rightarrow
→二进制:
bin(num)
- 十进制
→
\rightarrow
→八进制:
oct(num)
- 十进制
→
\rightarrow
→十六进制:
hex(num)
- n进制
→
\rightarrow
→十进制:
int('numstr',n)
获取整数的个位、十位、百位、。。。
方法一:
digit=[]
while n:
digit.append(n%10)
n=n//10
方法二:
digit=[int(_) for _ in str(n)]
collections标准库
Counter()
官方教程
一个 Counter 是一个 dict 的子类,用于计数可哈希对象。它是一个集合,元素像字典键(key)一样存储,它们的计数存储为值。计数可以是任何整数值,包括0和负数。
- 统计词频
from collections import Counter
colors = ['red', 'blue', 'red', 'green', 'blue', 'blue']
c = Counter(colors)
print (dict(c))
- 判断是否包含某元素,可以转化为dict然后通过dict判断,Counter也带有函数可以判断
c = Counter(['eggs', 'ham'])
c['bacon'] # 不存在就返回0
#0
- 删除元素:
c['sausage'] = 0 # counter entry with a zero count
del c['sausage']
- 获得所有元素:
c = Counter(a=4, b=2, c=0, d=-2)
list(c.elements())
#['a', 'a', 'a', 'a', 'b', 'b']
- 查看最常见出现的k个元素:
Counter('abracadabra').most_common(3)
#[('a', 5), ('r', 2), ('b', 2)]