文章目录
一、生成式
1、定义
生成式就是一个用来快速生成特定语法形式的表达式。
列表生成式:用来快速生成列表
字典生成式:用来快速生成字典
集合生成式:用来快速生成集合
2、语法格式
(1)普通的语法格式:[exp for iter_var in iterable]
(2)带过滤功能语法格式: [exp for iter_var in iterable if_exp]
(3)循环嵌套语法格式: [exp for iter_var_A in iterable_A for iter_var_B in iterable_B]
例如:
#(1)普通的语法格式:[exp for iter_var in iterable]
# 需求: 生成10个1~50之间的随机数值。
import random
def list_expression(count=10, start=0, end=50):
return [random.randint(start, end) for count in range(count)]
print(list_expression())
#(2)带过滤功能语法格式: [exp for iter_var in iterable if_exp]
# 需求: 找出1-50之间能被3整除的数值;
def list_expression(start=1, end=50, div_num=3):
return [num for num in range(start, end + 1) if num % div_num == 0]
print(list_expression())
#(3)循环嵌套语法格式: [exp for iter_var_A in iterable_A for iter_var_B in iterable_B]
nums = [item1+ item2 for item1 in 'abc' for item2 in '123']
print(nums)
运行结果:
#集合生成式
# 需求: 生成10个1~20之间的随机且不重复数值。
import random
nums = {
random.randint(1, 20) for count in range(10)}
print(nums)
3、生成式练习
# (1)求以r为半径的圆的面积和周长(r的范围从1到10)
import math
def circle_area(r):
return math.pi * pow(r,2)
def circle_perimeter(r):
return 2 * math.pi * r
area = [circle_area(r) for r in range(1, 11)]
perimeter = [circle_perimeter(r) for r in range(1,11)]
print(area)
print(perimeter)
#(2)找出1~100之间所有的质数
def is_prime(num):
"""判断是否为质数"""
for i in range(2, num):
if num % i == 0:
return False
else:
return True
def find_prime():
"""找出1~100之间所有的质数"""
return [num for num in range(1, 101) if is_prime(num)]
if __name__ == '__main__':
result = find_prime()
print(result)
#(3)将字典的key值和value值调换
def swap_key_value(dictObj):
return {
value: key for key, value in dictObj.items()}
if __name__ == '__main__':
d = {
'user1': 'passwd1',
'user2': 'passwd2',
}
result = swap_key_value(d)
print(result)
#字典key值大小写计数合并 : 已知字典{'A':10, 'b':5, 'a':2}, 合并后为{'a':12, 'b':5}
#注意: key值最终全部为小写
dict = {
'A':10, 'b':5, 'a':2}
d = {
key.lower(): (dict.get(key.lower(), 0) + dict.get(key.upper(), 0)) for key, value in dict.items()}
print(d)
二、生成器
1、定义和特点
(1)在python中,一边循环一边计算的机制,称为生成器(Generator)
(2)应用场景:
性能限制需要用到,比如读取一个10G的文件,如果一次性将10G的文件加载到内存处理的话 (read方法),内存肯定会溢出。但使用生成器把读写交叉处理进行,比如使用(readline和readlines) 就可以再循环读取的同时不断处理,这样就可以节省大量的内存空间。
(3)特点:
1> 解耦。 爬虫与数据存储解耦;
2> 减少内存占用.。随时生产, 即时消费, 不用堆积在内存当中;
3> 可不终止调用.。写上循环, 即可循环接收数据, 对在循环之前定义的变量, 可重复使用;
4> 生成器的循环, 在 yield 处中断, 没那么占 cpu
2、创建和访问
(1)创建:
方法一:列表生成式的改写。 []改成()
方法二:yield关键字
(2)访问:
方法一:通过for循环, 依次计算并生成每一个元素
方法二:通过 next() 函数一个一个获取
# 生成器创建方法一:
nums_gen = (num for num in range(1, 10001) if num % 8 == 0)
print(nums_gen) # <generator object <genexpr> at 0x7f8f2cb92350>
print(type(nums_gen)) # <class 'generator'>
# 查看一个对象是否可以for循环?
from collections.abc import Iterable
print("生成器是否为可迭代对象?", isinstance(nums_gen, Iterable))
# 访问方法一: 通过for循环, 依次计算并生成每一个元素。
"""
for num in nums_gen:
if num > 50:
break
print(num)
"""
# 访问方法二: 如果要一个一个打印出来,可以通过next()函数获得。
print(next(nums_gen)) # 执行一次next生成一个值
print(next(nums_gen))
print(next(nums_gen))
# 生成器创建方法二: 函数中包含yield关键字
def fib2(num):
"""不使用递归方式实现Fib数列,返回前num个fib数"""
count = 0
a = b = 1
while True:
if count < num:
count += 1
yield a
a, b = b, a + b
else:
break
# 如果函数中有yield关键字, 那么函数的返回值是生成器对象.
result = fib2(100)
print(result)