python列表推导式不会改变外部变量值,但是for循环会:
x = 'my precious'
dummy = [x for x in 'abc']
print(x) # x 的值依旧是 my precious
for x in 'def':
print(x)
print(x) # 这里可以看到 for 循环后 x 的值发生了改变
# 输出结果为:
my precious
d
e
f
f
注:python3
的推导式有自己的局部作用域类似于函数,但是python2
没有,所以python2
中的推导式也会改变外部变量的值。
生成器比列表推导式省内存
colors = ['black', 'white']
sizes = ['s', 'm', 'l']
# 列表推导式,先产出了一个列表,再执行迭代
for tshirt in ['%s %s' % (c, s) for c in colors for s in sizes]:
print(tshirt)
# 生成器遵循迭代协议,逐个产出元素,相交列表推导式节省了内存
for tshirt in ('%s %s' % (c, s) for c in colors for s in sizes):
print(tshirt)
divmod函数
print(divmod(20, 8)) # 将 20 除 8 的 商 和 余数 以元组的形式返回
# 输出:
(2, 4)
bisect模块之insort方法用于插入排序
import bisect
import random
SIZE = 7
random.seed(1729) # 指定种子后,无论运行多少次,输出的随机数是一样的
my_list = [] # 如果已有数据,该函数不会改变原有数据排序,只是依照大小插入新元素
for i in range(SIZE):
new_item = random.randrange(SIZE*2)
bisect.insort(my_list, new_item) # 将新的元素按照指定排序的方式插入已有序列
print('%2d ->' % new_item, my_list)
# 输出:
10 -> [10]
0 -> [0, 10]
6 -> [0, 6, 10]
8 -> [0, 6, 8, 10]
7 -> [0, 6, 7, 8, 10]
2 -> [0, 2, 6, 7, 8, 10]
10 -> [0, 2, 6, 7, 8, 10, 10]
使用bisect模块之bisect方法,查找数值将会插入目标序列的位置并返回索引值
import bisect
def grade(score, breakpoints=[60, 70, 80, 90], grades='FDCBA'):
# 查找应当插入的位置并返回,且不会改变目标序列
i = bisect.bisect(breakpoints, score) # 与bisect_right等效
# i = bisect.bisect_right(breakpoints, score)
# i = bisect.bisect_left(breakpoints, score)
return grades[i]
print([grade(score) for score in [33, 99, 88, 70, 89, 100, 90]])
# 输出结果
['F', 'A', 'B', 'C', 'B', 'A', 'A'] # default_result
['F', 'A', 'B', 'C', 'B', 'A', 'A'] # right_result
['F', 'A', 'B', 'D', 'B', 'A', 'B'] # left_result
一个统计文件单词频率的方法实现
import sys
import re
WORD_RE = re.compile(r'\w+') # 定义匹配规则为单词或数字字符
index = {} # 初始化字段,存储单词及其出现的位置(第几行第几列)
with open(sys.argv[1], encoding='utf-8') as fp: # 将文件名作为参数输入命令行执行
for line_no, line in enumerate(fp, 1):
for match in WORD_RE.finditer(line):
word = match.group()
column_no = match.start() + 1
location = (line_no, column_no)
index.setdefault(word, []).append(location) # 使用setdefault方法如果没有则初始化为空列表
for word in sorted(index, key=str.upper):
print(word, index[word])
关于range的趣味代码
x = 4
for i in range(x): # 一旦执行了range,可迭代对象就定了
print(i, "--------------------")
for j in range(x): # 在第二轮执行range的时候,根据变化了的x,重新生成了可迭代对象
print(i, j)
x = j
# 执行结果:
0 --------------------
0 0
0 1
0 2
0 3
1 --------------------
1 0
1 1
1 2
2 --------------------
2 0
2 1
3 --------------------
3 0
统计列表元素数量
from collections import Counter
data = [1, 3, 3, 5, 5, 5, 7, 7, 7, 7, 9, 9, 9, 9, 9]
counter = Counter(data)
print(counter)
# 执行结果
Counter({9: 5, 7: 4, 5: 3, 3: 2, 1: 1})