函数进阶
创建函数
def 语句
- 标题行由 def 关键字、函数的名字,以及参数的集合(如果有的话)组成
- def 子句的剩余部分包括了一个虽然可选但是强烈推荐的文档字串,和必需的函数体
前向引用
- 函数不允许在函数未声明之前,对其进行引用或者调用
- 定义函数时,函数的先后顺序不重要,重要的是 函数在什么位置被调用
调用函数
- 使用一对圆括号() 调用函数,如果没有圆括号,只是对函数的引用
- 任何输入的参数都是必须放置在括号中
关键字参数
- 关键字参数的概念仅仅针对函数的调用
- 这种理念是 让调用者通过函数调用中的参数名字来区分参数
- 这种规范允许参数不按顺序
- 位置参数应写在关键字参数前面
# 默认参数:定义函数,给形参的默认值
def get_info(name, age=20):
print("%s is %s years old" % (name, age))
# 按照位置传参
get_info("nfx") # name="nfx" age=20
get_info("nfx", 18) # name="nfx" age=18
get_info(18, "nfx") # name=18 age="nfx"
# 关键字传参(指名道姓): 可以不按照顺序传参
get_info(name="nfx", age=18)
get_info(age=18, name="nfx")
# 注意: 关键字参数后不能有位置参数
get_info("nfx", age=20)
# get_info(name="nfx", 20): 报错
print("hello", "world", sep="---", end="!!\n")
练习 1:简单的加减法数学游戏
需求
- 随机生成两个100以内的数字
- 随机选择加法或是减法
- 总是使用大的数字减去小的数字
import random
def exam():
nums = [random.randint(1,100) for i in range(2)]
nums.sort(reverse=True)# 列表降序排列 [大数, 小数]
tmp = random.choice("+-") # 随机出操作符
# result: 是题目的正确答案
if tmp == "+":
result = nums[0] + nums[1]
else: # tmp == "-"
result = nums[0] - nums[1]
# 10 + 5 = ?? 请作答: answer: 计算的答案
answer = int(input("%s %s %s = ?? 请作答: " % (nums[0], tmp, nums[1]))
if answer == result:
print("Very Good~~~")
else:
print("Wrong answer!!!")
def show_menu():
while True:
exam()
tmp = input("退出(n/N): ") # 只限制退出
if tmp in "nN":
print("Byebye~")
break
if __name__ == '__main__'
show_menu()
匿名函数
- python 允许用 lambda 关键字创造匿名函数
- 匿名是因为不需要以标准的 def 方式来声明
- 一个完整的 lambda "语句"代表了一个表达式,这个表达式定义体必须和声明放在同一行
def add(x, y):
return x+y
def func01(num):
# if num % 2 == 1:
# return True
# else:
# return False
# if表达式
return True if num % 2 == 1 else False
test = lambda num: True if num % 2 == 1 else False
print(test(100)) # False
myadd = lambda x, y: x+y # 显示调用不推荐
print(myadd(100, 200)) # x = 100, y = 200
print(add(1, 2))
变量作用域
全局变量
- 标识符的作用域是定义为其声明在程序里的可应用范围,也就是变量的可见性
- 在一个模块中最高级别的变量有全局作用域
- 全局变量的一个特征是除非被删除掉,否则他们会存活到脚本运行结束,且对于所有的函数,他们的值都是可以被访问的
局部变量
- 局部变量只是暂时的存在,仅仅只依赖于定义他们的函数现阶段是否处于活动
- 当一个函数调用出现时,其局部变量就进入声明它们的作用域。在那一刻,一个新的局部变量名为那个对象创建了
- 一旦函数完成,框架被释放,变量将会离开作用域
- 如果局部变量与全局变量有相同的名称,那么函数运行时,局部变量的名称将会把全局变量的名称遮盖住
global 语句
- 因为全局变量的名字能被局部变量给遮盖掉
- 为了明确地引用一个已命名的全局变量,必须使用 global 语句
>>> x = 100 #定义全局变量x >>> def func6(): #定义函数func6() ... global x #引用全局变量x ... x = 200 #为全局变量x赋值为200 ... print(x) #打印变量x的值 ... >>> func6() #调用函数func6() >>> x
查找变量或函数的顺序
- 首先在函数的内部去查找
- 函数内部没有,然后去全局去查找,看是否定义
- 全局也没有,最后会去内建函数中查找
# 验证python查找变量或函数的顺序,定义函数func7(),统计字符'abcd'的长度
>>> def func7():
... print(len('abcd'))
...
>>> func7() #调用函数,结果为4,正确
>>> len #全局查看是否有len,没有,不存在
# 先在函数func7()内部查找方法len(),再在全局查找,最后在内建中查找len()
生成器
Python 使用生成器对延迟操作提供了支持。所谓延迟操作,是指在需要的时候才产生结果,而不是立即产生结果。这也是生成器的主要好处。
Python有两种不同的方式提供生成器:
-
生成器函数:
- 常规函数定义,但是,使用 yield 语句而不是 return 语句返回结果
- yield 语句一次返回一个结果,在每个结果中间,挂起函数的状态,以便下次重它离开的地方继续执行
# 生成器函数
# return: 函数执行的终止
# yield: 表示函数执行的暂停
def func02():
a = 1
yield a
b = "hello"
yield b
c = [1, 2]
yield c
gen2 = func02()
print("gen2:", gen2)
# <generator object func02 at 0x7f94da357a98>
print(gen2.__next__()) # 1
print(gen2.__next__()) # hello
for item in gen2:
print("for:", item) # [1, 2]
# gen2.__next__() # 报错
生成器表达式:
- 类似于列表推导,但是,生成器返回按需产生结果的一个对象,而不是一次构建一个结果列表
# 列表推导式
import random
list01 = [random.randint(1, 5) for i in range(5)]
print(list01) # [1, 3, 4, 1, 2]
# 生成器表达式
gen01 = (random.randint(1, 5) for i in range(5))
print(gen01) # <generator object <genexpr> at 0x7f18cc1c8830>
# 生成器当中的元素只能获取一遍
# for 生成器.__next__()
print("data:", gen01.__next__()) # 第一个数据
print("data:", gen01.__next__()) # 第二个数据
for item in gen01:
print("for:", item)
# print("data:", gen01.__next__()) # 报错:StopIteration
生成器的好处在于延迟操作,需要的时候再使用,所以会节省空间
sum([i for i in range(100000000)])
sum((i for i in range(100000000)))
-
注意事项
-
生成器的唯一注意事项就是:生成器只能遍历一次
-
自定义生成器函数的过程
- 在函数内部,有很多 yield 返回中间结果;
- 程序向函数取值时,当函数执行到第1个yield时,会暂停函数运行并返回中间结果;
- 当主程序再次调用函数时,函数会从上次暂停的位置继续运行,当遇到第2个yield,会再次暂停运行函数并返回数据;
- 重复以上操作,一直到函数内部的yield全部执行完成为止
-
练习 :文件生成器
需求:通过生成器完成以下功能
- 使用函数实现生成器 yield
- 函数接受一个文件路径作为参数(读文件)
- 生成器函数每次返回文件的 10 行数据
需求:通过生成器完成以下功能
#
# 使用函数实现生成器 yield
# 函数接受一个文件路径作为参数(读文件)
# 生成器函数每次返回文件的 10 行数据
#首先:敲定数据存储类型
#set:去重、交并
# dict:查询
# tuple:不变、存储
# list:可变
#程序=数据类型(list)+算法
#1.按行读取文件(while True+readline ,readlines)
#2.每读取一行数据,向列表中添加该行记录
#3.判断此时列表的长度是否为10
# 3.1长度为10:yield返回列表,清空列表元素
# 3.2长度不为10:向列表中添加行数据
#4.文件读取完毕时,需判断列表是否为空,不为空:yield列表数据
def get_file(path):
lines = []
with open(path,mode='r') as fr:
for item in fr.readlines():
lines.append(item)
if len(lines) ==10:
yield lines
lines.clear()
if len(lines) != 0:
yield lines
if __name__ == '__main__':
for item in get_file("/etc/passwd"):
print(item)
print("=======================")
方法二:
with open(path,mode="r") as fr:
list01=[]
n=0
list01=fr.readlines();
while len(list01)-n > 0:
print(n)
if len(list01)-n >=10:
list02=[]
list02=list01[n:n+10]
yield list02
else :
list02=[]
list02=list01[n:]
yield list02
n += 10
模块详解
模块
基本概念
- 模块支持从逻辑上组织 python 代码
- 当代码量变得非常大的时候,最好把代码分成一些有组织的代码段
- 代码片段相互间有一定的联系,可能是一个包含数据成员和方法的类,也可能是一组相关但彼此独立的操作函数
- 这些代码段是共享的,所有 python 允许 “调入” 一个模块,允许使用其他模块的属性来利用之前的工作成果,实现代码重用
作用
- 模块可以实现代码的重用,导入模块,就可以使用模块中已经定义好的类,函数和变量,减少代码的冗余性
模块文件
- 模块是从逻辑来组织 python 代码的方法,文件是物理层上组织模块的方法
- 一个文件被看作是一个独立模块,一个模块也可以被看作是一个文件
- 模块的文件名就是模块的名字加上扩展名 .py
搜索路径
- 模块的导入需要一个叫做 “路径搜索” 的过程
- python 在文件系统 “预定义区域” 中查找要调用的模块
- 搜索路径在 sys.path 中定义
- 也可以通过 PYTHONPATH 环境变量引入自定义目录
导入模块
查看模块的默认搜索路径
>>> import sys #导入模块sys
>>> sys.path #path, 查看python搜索模块时的默认查找路径
模块导入方法
- 使用import导入模块
- 可以在一行导入多个模块,但是可读性会下降
- 可以只导入模块的某些属性
- 导入模块时,可以为模块取别名
>>> import time, os, sys
>>> from random import choice
>>> import pickle as p
- 当导入模块时,模块的顶层代码会被执行
- 一个模块不管被导入(import)多少次,只会被加载(load)一次
[root@localhost ~]# mkdir /tmp/mylibs
[root@localhost ~]# vim /tmp/mylibs/nfx.py
[root@localhost ~]# cat /tmp/mylibs/nfx.py
def hehe():
print("hello nfx~")
[root@localhost ~]# python3 # 当前路径: /root
>>> import nfx # 失败: No module named 'nfx'
# export只对当前终端临时生效
[root@localhost ~]# export PYTHONPATH=/tmp/mylibs
[root@localhost ~]# python3
>>> import sys
>>> sys.path # 将/tmp/mylibs添加到了模块搜索路径中
['', '/tmp/mylibs', ....]
>>> import nfx # 成功
>>> nfx.hehe() # 模块名.函数()
内置模块
hashlib 模块
- hashlib 用来替换 MD5 和 sha 模块,并使他们的API一致,专门提供hash算法
- 包括md5、sha1、sha224、sha256、sha384、sha512,使用非常简单、方便
import hashlib #1.一次性计算 m = hashlib.md5(b"123456") print(m.hexdigest()) #2.分批计算 m2=hashlib.md5() m2.update(b"12") m2.update(b"34") m2.update(b"56") print(m2.hexdigest())
案例:验证大文件
import hashlib
def get_md5(path):
m = hashlib.md5()
with open(path,mode="rb") as fr:
while True:
data=fr.read(4096*16)
if len(data)==0:
break
else:
m.update(data)
return m.hexdigest()
if __name__ == '__main__':
print(get_md5("/etc/hosts"))
#在linux命令行中输入 md5 /etc/hosts 验证是否一样
tarfile 模块
- tarfile模块允许创建、访问 tar 文件
- 同时支持 gzip、bzip2 格式
>>> import tarfile #在local下, 导入模块tarfile【实现文件的打包和解压】
>>> tar = tarfile.open('/tmp/demo.tar.gz', 'w:gz') #以'w:gz'的格式,打开包文件,文件不存在则会自动创建
>>> tar.add('/etc/hosts') #向包文件中压缩文件/etc/hosts
>>> tar.add('/etc/security') #向包文件中压缩目录/etc/security
>>> tar.close() #关闭文件
[root@localhost day02]# ls -l /tmp/demo.tar.gz
>>> tar = tarfile.open('/tmp/demo.tar.gz') #打开文件,文件已经存在,则不需要指定类型,python会自动选择
>>> tar.extractall(path='/var/tmp') #解压到 /var/tmp目录下,不指定解压到当前目录
>>> tar.close() #关闭文件
[root@localhost day07]# ls /var/tmp/etc/ #查看软件包demo.tar.gz是否解压成功