Python三大神器（迭代器、生成器、装饰器）和csv文件操作

本文链接：https://blog.csdn.net/m0_57864180/article/details/123460788

三大神器和csv文件操作

迭代器

1.什么是迭代器(iter)

迭代器是容器型数据类型
特点：
- 无法通过打印迭代器查看元素、也无法统计元素个数
- 需要使用元素的时候必须将元素从迭代器中取出，取出以后该元素就从迭代器中消失

2.创建迭代器 - 将其他序列转换成迭代器

i1 = iter('hello')
i2 = iter([10, 20, 30, 40])
i3 = iter({'a': 10, 'b': 20})
i4 = iter({100, 200, 300})
print(i1)       # <str_iterator object at 0x7fc25598fc40>
print(i2)       # <list_iterator object at 0x7fb21888fc70>
print(i3)
print(i4)
# print(len(i1))        # 报错！TypeError: object of type 'str_iterator' has no len()

3.获取迭代器的元素

不管以什么的方式获取到了迭代器的元素，被获取到的元素一定会从迭代器中消失

获取单个元素: next(迭代器)

i1 = iter('hello')
print(next(i1))     # 'h'
print(next(i1))     # 'e'
print(next(i1))     # 'l'
print(next(i1))     # 'l'
print(next(i1))     # 'o'
# print(next(i1))     # 报错!StopIteration

result = list(i1)
print(result)       # []

i1 = iter('hello')
print(list(i1))     # ['h', 'e', 'l', 'l', 'o']
# print(next(i1))     # 报错！StopIteration

遍历

i1 = iter('hello')
for x in i1:
    print(f'x:{x}')

print(list(i1))


from re import finditer, findall
result = finditer(r'(?i)[a-z](\d+)', '按时sh233数据==2231bhs901bb =8决胜巅峰23 sjn823')
print(list(result))

result = findall(r'(?i)[a-z](\d+)', '按时sh233数据==2231bhs901bb =8决胜巅峰23 sjn823')
print(result)


result = findall(r'(?i)([a-z])\d+\1', '按时sh233h数据==2231bhs901bb =8决胜巅峰23 sjn823n')
print(result)

result = finditer(r'(?i)([a-z])(\d+)\1', '按时sh233h数据==2231bhs901bb =8决胜巅峰23 sjn823n')
print(result)       # <callable_iterator object at 0x7fdb35213f40>
for x in result:
    print(x.group(2))

生成器

1.什么是生成器

生成器是一种容器，但是这个保存的不是多个数据，而是产生(创建)多个数据的算法
同时具有迭代器保存数据的特点:
- 打印看不到内容
- 不支持len操作
- 元素也是取一个就少一个，而且不能再放回生成器中
注意：生成器获取元素和迭代器获取元素的方法一样

2.创建生成器

调用一个带有yield关键的函数就可以得到一个生成器对象

注意: 如果函数中有yield,那么调用这个函数不会执行函数体，也不会获取函数返回值，而是创建一个生成器对象

def func1():
    print('hello')
    yield
    return 100


result = func1()
print(result)

3.控制生成器产生数据的个数和值

生成器产生数据的个数和值，由执行函数体的时候会遇到几次yield，以及每次遇到yield的时候后的值来决定

def func2():
    yield 100
    yield 200
    yield 300


g1 = func2()
print(list(g1))     # [100, 200, 300]
# print(next(g1))   # 报错！StopIteration


def func3():
    for x in range(10):
        yield x*2


g2 = func3()


# 练习：创建学科学号的生成器,能产生从 'python001' 到 'python999' 的学号
def study_id(subject):
    for x in range(1, 1000):
        yield f'{subject}{x:0>3}'


g3 = study_id('python')
g4 = study_id('java')
print(next(g3))
print(next(g3))

print(next(g4))

print(next(g3))

print(next(g4))

4.生成器创建数据的原理

调用函数创建生成器的时候不会执行函数体，在通过生成器对象获取生成器中的元素的时候才会执行函数，而且每次在执行函数体的时候只会执行到yield就停止，并且记录停止的位置，下次再获取元素的时候从上次结束的位置接着执行。

def func4():
    print('======1======')
    yield 100
    print('======2======')
    yield 200
    print('======3======')
    yield 300


g4 = func4()
print(next(g4))
print(next(g4))
print(next(g4))


def func5():
    yield 100
    yield 200
    yield 300


# print(next(func5()))        # 100
# print(next(func5()))        # 100
g5 = func5()
print(next(g5))
print(next(g5))

装饰器（了解）

装饰器是用来给函数添加功能

通过直接修改原函数的代码可以给函数添加功能

存在的问题：
- 如果多个函数需要添加同样的功能，需要修改多个函数的代码，并且添加相同的代码
- 如果想要取消添加的功能，又要重新修改多个函数的函数

使用装饰器

写装饰器的套路:

def 装饰器名(f):
    def new_f(*args, **kwargs):
        实现新增的功能
        result = f(*args, **kwargs)
        实现新增的功能
        return result
    return new_f

def count_time(f):
    def new_f(*args, **kwargs):
        start = time.time()
        result = f(*args, **kwargs)
        end = time.time()
        print(f'执行时间:{end-start}')
        return result
    return new_f


@count_time
def func1():
    print('hello world!')


@count_time
def func2(a, b):
    print(a + b)


func1()
func2(12, 23)


# 写一个装饰器，将返回值是数字的原函数的返回值乘以10000
def magnify(f):
    def new_f(*args, **kwargs):
        result = f(*args, **kwargs)
        if type(result) in (int,float):
            return result * 10000
        return result
    return new_f


@magnify
def func3(a, b):
    return a * b


result = func3(4, 5)
print(result)

result = func3('abc', 2)
print(result)


class A:
    @classmethod
    def func1(cls):
        pass

    @staticmethod
    def func2():
        pass

csv文件操作

csv文件(逗号分隔值文件) - 让数据以表格的方式存储(更简单的表格文件)

使用时要导入：import csv

1.csv文件读操作

方法1 - 读文件内容得到一个迭代器，迭代器中的元素是每一行内容对应的列表
- 创建reader对象: csv.reader(文件对象) - 创建文件对应的reader，并且获取文件内容
  
  注意：打开csv文件的时候需要给参数newline赋值为空串
```
reader1 = csv.reader(open('files/2018年北京积分落户数据.csv', encoding='utf-8', newline=''))
```
- 通过reader对象(本质是一个迭代器)获取文件内容
```
print(next(reader1))     # ['id', 'name', 'birthday', 'company', 'score']
print(list(reader1))
```

方法2 - 读文件内容得到一个迭代器，迭代器中的元素是每一行内容对应的字典(键是每一列的第一行数据)

reader2 = csv.DictReader(open('files/2018年北京积分落户数据.csv', encoding='utf-8', newline=''))
for x in reader2:
    print(x)

2.csv文件写操作

方法1 - 以列表为单位写入一行数据

创建writer对象: csv.writer(文件对象)

writer1 = csv.writer(open('files/students.csv', 'w', encoding='utf-8', newline=''))

写入数据

writer对象.writerow(列表) - 一次写入一行数据
writer对象.writerows(元素是列表的列表) - 同时写入多行数据

writer1.writerow(['学号', '姓名', '年龄', '电话', '分数'])
writer1.writerows([
    ['stu001', '小明', 19, '110', 98],
    ['stu002', '张三', 23, '199', 72],
    ['stu003', '小花', 22, '1728', 78]
])

方法2 - 以字典为单位写入一行数据

创建DictWriter对象: csv.DictWriter(文件对象, 字典的键)

writer2 = csv.DictWriter(
    open('files/dogs.csv', 'w', encoding='utf-8', newline=''),
    ['狗名', '年龄', '品种', '价格']
)

将字典的键作为文件内容写入文件的第一行
```
writer2.writeheader()
```

写入数据

writer对象.writerow(字典) - 一次写入一行数据
writer对象.writerows(元素是字典的列表) - 同时写入多行数据

writer2.writerow({'狗名': '旺财', '年龄': 3, '品种': '哈巴狗', '价格': 500})
writer2.writerows([
    {'狗名': '猜猜', '年龄': 2, '品种': '哈士奇', '价格': 1500},
    {'狗名': '土豆', '年龄': 1, '品种': '土狗', '价格': 50},
    {'狗名': '妞妞', '年龄': 3, '品种': '金毛', '价格': 2500}
])