3.异常
Python中的异常(Exception)是在程序运行期间发生的错误或异常情况,它们可以干扰正常的程序执行流程。Python提供了强大的异常处理机制,允许您检测、捕获、处理和报告异常,以增加程序的健壮性。
1. 异常类别:
- Python中的异常都是从内置的
BaseException
类派生而来的。异常分为两大类:- 内置异常:由Python内核引发的异常,如
ZeroDivisionError
、TypeError
、FileNotFoundError
等。 - 自定义异常:您可以创建自己的异常类,以便在特定情况下引发和捕获异常。
- 内置异常:由Python内核引发的异常,如
2. 异常处理语句:
- Python提供了以下异常处理语句来处理异常:
try
:用于包含可能引发异常的代码块。except
:用于捕获并处理异常的代码块。finally
:可选的,用于包含一定会执行的代码块,无论是否发生异常。else
:可选的,用于包含在没有异常发生时执行的代码块。
3. 异常处理流程:
- 当
try
代码块中发生异常时,Python会停止执行try
块内的代码,跳转到匹配的except
块,并执行异常处理代码。 - 如果没有匹配的
except
块,异常将向上级作用域传播,直到找到匹配的except
块,或者导致程序终止。
4. 捕获多个异常:
- 您可以在一个
try
块中捕获多个不同类型的异常,并为每种类型的异常提供对应的except
块。
try:
# 代码可能引发异常的地方
except FileNotFoundError:
# 处理文件未找到异常
except ZeroDivisionError:
# 处理除零异常
except Exception as e:
# 处理其他异常,并将异常信息保存在变量e中
5. 异常对象:
- 当异常发生时,Python会创建一个异常对象,其中包含有关异常的信息,如异常类型、描述和发生异常的位置。
- 您可以使用
except
块中的变量来访问异常对象。
try:
result = 10 / 0
except ZeroDivisionError as e:
print(f"An exception occurred: {e}")
6. 抛出异常:
- 您可以使用
raise
语句来手动引发异常,这对于创建自定义异常非常有用。
def divide(a, b):
if b == 0:
raise ZeroDivisionError("Division by zero is not allowed.")
return a / b
7. 使用finally
:
finally
块用于包含一定会执行的代码,无论是否发生异常。它通常用于清理资源或执行必要的收尾工作。
try:
# 代码可能引发异常的地方
except Exception:
# 处理异常
finally:
# 无论是否发生异常,都会执行此块的代码
8. 自定义异常:
- 您可以通过创建自定义异常类来扩展Python的异常处理能力,以更好地适应特定应用程序的需求。
class CustomError(Exception):
def __init__(self, message):
super().__init__(message)
try:
if something_is_wrong:
raise CustomError("Something went wrong!")
except CustomError as e:
print(f"Custom error occurred: {e}")
9. 异常链:
- 在处理异常时,您可以使用
from
关键字来指定一个异常引发另一个异常的原因。
try:
result = 10 / 0
except ZeroDivisionError as e:
raise ValueError("Invalid input") from e
总之,异常处理是Python编程中非常重要的一部分。它允许您有效地处理错误情况,提高程序的健壮性,同时还可以提供有关错误的详细信息,以便进行调试和改进。了解如何使用try
、except
、finally
和raise
等关键字,以及如何创建自定义异常,是编写高质量Python代码的关键。
4.OS
Python的操作系统模块(os
模块)是一个强大的工具,用于与操作系统进行交互,执行各种文件和目录操作,获取系统信息等。
1. 导入 os
模块:
- 要使用
os
模块,首先需要导入它。通常使用以下方式导入:
import os
2. 文件和目录操作:
os
模块允许您执行各种文件和目录操作,包括:- 创建目录:
os.mkdir('my_directory')
- 删除目录:
os.rmdir('my_directory')
- 重命名文件或目录:
os.rename('old_name', 'new_name')
- 删除文件:
os.remove('file_name')
- 检查文件或目录是否存在:
os.path.exists('path')
- 获取文件或目录的绝对路径:
os.path.abspath('path')
- 列出目录中的文件和子目录:
os.listdir('directory_path')
- 创建目录:
3. 当前工作目录:
os.getcwd()
函数返回当前工作目录的路径。os.chdir('new_directory')
函数用于更改当前工作目录。
4. 路径操作:
os.path
模块用于处理文件和目录的路径:os.path.join(path1, path2, ...)
:将多个路径组合成一个。os.path.basename(path)
:获取路径中的文件或目录名。os.path.dirname(path)
:获取路径中的目录名。os.path.exists(path)
:检查路径是否存在。os.path.isfile(path)
:检查路径是否为文件。os.path.isdir(path)
:检查路径是否为目录。
5. 环境变量:
os.environ
包含了当前进程的环境变量,以字典形式存储。- 可以使用
os.environ.get('variable_name')
获取特定环境变量的值。
6. 执行系统命令:
- 使用
os.system('command')
可以在Python中执行操作系统命令,例如运行外部程序或脚本。
7. 文件路径的分隔符:
os.sep
或os.path.sep
包含了当前操作系统的文件路径分隔符(/
或\
)。- 这对于编写可跨平台的代码非常有用。
8. 文件和目录权限:
os.chmod('path', mode)
用于更改文件或目录的权限模式。os.access('path', mode)
用于检查文件或目录的权限。
9. 其他系统信息:
os.name
包含了当前操作系统的名称(‘posix’ 或 ‘nt’ 等)。os.uname()
函数(仅在 Unix-like 系统上可用)返回有关操作系统的详细信息。
10. 异常处理:
- 在使用 os
模块时,需要处理可能引发的异常,如文件不存在或无权限等。通常使用 try
和 except
语句来处理异常情况。
import os
try:
os.remove('file_name')
except FileNotFoundError:
print("File not found.")
except PermissionError:
print("Permission denied.")
线程类似于同时执行多个不同程序,多线程运行有如下优点:
- 使用线程可以把占据长时间的程序中的任务放到后台去处理。
- 用户界面可以更加吸引人,比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度。
- 程序的运行速度可能加快。
- 在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。
每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制。
每个线程都有他自己的一组CPU寄存器,称为线程的上下文,该上下文反映了线程上次运行该线程的CPU寄存器的状态。
指令指针和堆栈指针寄存器是线程上下文中两个最重要的寄存器,线程总是在进程得到上下文中运行的,这些地址都用于标志拥有线程的进程地址空间中的内存。
- 线程可以被抢占(中断)。
- 在其他线程正在运行时,线程可以暂时搁置(也称为睡眠) – 这就是线程的退让。
线程可以分为:
- **内核线程:**由操作系统内核创建和撤销。
- **用户线程:**不需要内核支持而在用户程序中实现的线程。
Python3 线程中常用的两个模块为:
- _thread
- threading(推荐使用)
thread 模块已被废弃。用户可以使用 threading 模块代替。所以,在 Python3 中不能再使用"thread" 模块。为了兼容性,Python3 将 thread 重命名为 “_thread”。
5.多线程
多线程类似于同时执行多个不同程序,多线程运行有如下优点:
- 使用线程可以把占据长时间的程序中的任务放到后台去处理。
- 用户界面可以更加吸引人,比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度。
- 程序的运行速度可能加快。
- 在一些等待的任务实现上如用户输入、文件读写和网络收发数据等,线程就比较有用了。在这种情况下我们可以释放一些珍贵的资源如内存占用等等。
每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能够独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制。
每个线程都有他自己的一组CPU寄存器,称为线程的上下文,该上下文反映了线程上次运行该线程的CPU寄存器的状态。
指令指针和堆栈指针寄存器是线程上下文中两个最重要的寄存器,线程总是在进程得到上下文中运行的,这些地址都用于标志拥有线程的进程地址空间中的内存。
- 线程可以被抢占(中断)。
- 在其他线程正在运行时,线程可以暂时搁置(也称为睡眠) – 这就是线程的退让。
线程可以分为:
- **内核线程:**由操作系统内核创建和撤销。
- **用户线程:**不需要内核支持而在用户程序中实现的线程。
Python3 线程中常用的两个模块为:
- _thread
- threading(推荐使用)
thread 模块已被废弃。用户可以使用 threading 模块代替。所以,在 Python3 中不能再使用"thread" 模块。为了兼容性,Python3 将 thread 重命名为 “_thread”。
1.多线程的创建
Python中使用线程有两种方式:函数或者用类来包装线程对象。
函数式:调用 _thread 模块中的start_new_thread()函数来产生新线程。语法如下:
_thread.start_new_thread ( function, args[, kwargs] )
参数说明:
- function - 线程函数。
- args - 传递给线程函数的参数,他必须是个tuple类型。
- kwargs - 可选参数。
#!/usr/bin/python3
import _thread
import time
# 为线程定义一个函数
def print_time( threadName, delay):
count = 0
while count < 5:
time.sleep(delay)
count += 1
print ("%s: %s" % ( threadName, time.ctime(time.time()) ))
# 创建两个线程
try:
_thread.start_new_thread( print_time, ("Thread-1", 2, ) )
_thread.start_new_thread( print_time, ("Thread-2", 4, ) )
except:
print ("Error: 无法启动线程")
while 1:
pass
执行以上程序输出结果如下:
Thread-1: Wed Jan 5 17:38:08 2022
Thread-2: Wed Jan 5 17:38:10 2022
Thread-1: Wed Jan 5 17:38:10 2022
Thread-1: Wed Jan 5 17:38:12 2022
Thread-2: Wed Jan 5 17:38:14 2022
Thread-1: Wed Jan 5 17:38:14 2022
Thread-1: Wed Jan 5 17:38:16 2022
Thread-2: Wed Jan 5 17:38:18 2022
Thread-2: Wed Jan 5 17:38:22 2022
Thread-2: Wed Jan 5 17:38:26 2022
执行以上程后可以按下 ctrl-c 退出。
2.线程模块
Python3 通过两个标准库 _thread 和 threading 提供对线程的支持。
_thread 提供了低级别的、原始的线程以及一个简单的锁,它相比于 threading 模块的功能还是比较有限的。
threading 模块除了包含 _thread 模块中的所有方法外,还提供的其他方法:
- threading.currentThread(): 返回当前的线程变量。
- threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
- threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。
除了使用方法外,线程模块同样提供了Thread类来处理线程,Thread类提供了以下方法:
-
run(): 用以表示线程活动的方法。
-
start():
启动线程活动。
-
join([time]): 等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。
-
isAlive(): 返回线程是否活动的。
-
getName(): 返回线程名。
-
setName(): 设置线程名。
使用 threading 模块创建线程
我们可以通过直接从 threading.Thread 继承创建一个新的子类,并实例化后调用 start() 方法启动新线程,即它调用了线程的 run() 方法:
#!/usr/bin/python3
import threading
import time
exitFlag = 0
class myThread (threading.Thread):
def __init__(self, threadID, name, delay):
threading.Thread.__init__(self)
self.threadID = threadID
self.name = name
self.delay = delay
def run(self):
print ("开始线程:" + self.name)
print_time(self.name, self.delay, 5)
print ("退出线程:" + self.name)
def print_time(threadName, delay, counter):
while counter:
if exitFlag:
threadName.exit()
time.sleep(delay)
print ("%s: %s" % (threadName, time.ctime(time.time())))
counter -= 1
# 创建新线程
thread1 = myThread(1, "Thread-1", 1)
thread2 = myThread(2, "Thread-2", 2)
# 开启新线程
thread1.start()
thread2.start()
thread1.join()
thread2.join()
print ("退出主线程")
以上程序执行结果如下;
开始线程:Thread-1
开始线程:Thread-2
Thread-1: Wed Jan 5 17:34:54 2022
Thread-2: Wed Jan 5 17:34:55 2022
Thread-1: Wed Jan 5 17:34:55 2022
Thread-1: Wed Jan 5 17:34:56 2022
Thread-2: Wed Jan 5 17:34:57 2022
Thread-1: Wed Jan 5 17:34:57 2022
Thread-1: Wed Jan 5 17:34:58 2022
退出线程:Thread-1
Thread-2: Wed Jan 5 17:34:59 2022
Thread-2: Wed Jan 5 17:35:01 2022
Thread-2: Wed Jan 5 17:35:03 2022
退出线程:Thread-2
退出主线程
3.线程同步
如果多个线程共同对某个数据修改,则可能出现不可预料的结果,为了保证数据的正确性,需要对多个线程进行同步。
使用 Thread 对象的 Lock 和 Rlock 可以实现简单的线程同步,这两个对象都有 acquire 方法和 release 方法,对于那些需要每次只允许一个线程操作的数据,可以将其操作放到 acquire 和 release 方法之间。如下:
多线程的优势在于可以同时运行多个任务(至少感觉起来是这样)。但是当线程需要共享数据时,可能存在数据不同步的问题。
考虑这样一种情况:一个列表里所有元素都是0,线程"set"从后向前把所有元素改成1,而线程"print"负责从前往后读取列表并打印。
那么,可能线程"set"开始改的时候,线程"print"便来打印列表了,输出就成了一半0一半1,这就是数据的不同步。为了避免这种情况,引入了锁的概念。
锁有两种状态——锁定和未锁定。每当一个线程比如"set"要访问共享数据时,必须先获得锁定;如果已经有别的线程比如"print"获得锁定了,那么就让线程"set"暂停,也就是同步阻塞;等到线程"print"访问完毕,释放锁以后,再让线程"set"继续。
经过这样的处理,打印列表时要么全部输出0,要么全部输出1,不会再出现一半0一半1的尴尬场面。
#!/usr/bin/python3
import threading
import time
class myThread (threading.Thread):
def __init__(self, threadID, name, delay):
threading.Thread.__init__(self)
self.threadID = threadID
self.name = name
self.delay = delay
def run(self):
print ("开启线程: " + self.name)
# 获取锁,用于线程同步
threadLock.acquire()
print_time(self.name, self.delay, 3)
# 释放锁,开启下一个线程
threadLock.release()
def print_time(threadName, delay, counter):
while counter:
time.sleep(delay)
print ("%s: %s" % (threadName, time.ctime(time.time())))
counter -= 1
threadLock = threading.Lock()
threads = []
# 创建新线程
thread1 = myThread(1, "Thread-1", 1)
thread2 = myThread(2, "Thread-2", 2)
# 开启新线程
thread1.start()
thread2.start()
# 添加线程到线程列表
threads.append(thread1)
threads.append(thread2)
# 等待所有线程完成
for t in threads:
t.join()
print ("退出主线程")
执行以上程序,输出结果为:
开启线程: Thread-1
开启线程: Thread-2
Thread-1: Wed Jan 5 17:36:50 2022
Thread-1: Wed Jan 5 17:36:51 2022
Thread-1: Wed Jan 5 17:36:52 2022
Thread-2: Wed Jan 5 17:36:54 2022
Thread-2: Wed Jan 5 17:36:56 2022
Thread-2: Wed Jan 5 17:36:58 2022
退出主线程
4.线程优先级队列( Queue)
Python 的 Queue 模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列 PriorityQueue。
这些队列都实现了锁原语,能够在多线程中直接使用,可以使用队列来实现线程间的同步。
Queue 模块中的常用方法:
- Queue.qsize() 返回队列的大小
- Queue.empty() 如果队列为空,返回True,反之False
- Queue.full() 如果队列满了,返回True,反之False
- Queue.full 与 maxsize 大小对应
- Queue.get([block[, timeout]])获取队列,timeout等待时间
- Queue.get_nowait() 相当Queue.get(False)
- Queue.put(item) 写入队列,timeout等待时间
- Queue.put_nowait(item) 相当Queue.put(item, False)
- Queue.task_done() 在完成一项工作之后,Queue.task_done()函数向任务已经完成的队列发送一个信号
- Queue.join() 实际上意味着等到队列为空,再执行别的操作
#!/usr/bin/python3
import queue
import threading
import time
exitFlag = 0
class myThread (threading.Thread):
def __init__(self, threadID, name, q):
threading.Thread.__init__(self)
self.threadID = threadID
self.name = name
self.q = q
def run(self):
print ("开启线程:" + self.name)
process_data(self.name, self.q)
print ("退出线程:" + self.name)
def process_data(threadName, q):
while not exitFlag:
queueLock.acquire()
if not workQueue.empty():
data = q.get()
queueLock.release()
print ("%s processing %s" % (threadName, data))
else:
queueLock.release()
time.sleep(1)
threadList = ["Thread-1", "Thread-2", "Thread-3"]
nameList = ["One", "Two", "Three", "Four", "Five"]
queueLock = threading.Lock()
workQueue = queue.Queue(10)
threads = []
threadID = 1
# 创建新线程
for tName in threadList:
thread = myThread(threadID, tName, workQueue)
thread.start()
threads.append(thread)
threadID += 1
# 填充队列
queueLock.acquire()
for word in nameList:
workQueue.put(word)
queueLock.release()
# 等待队列清空
while not workQueue.empty():
pass
# 通知线程是时候退出
exitFlag = 1
# 等待所有线程完成
for t in threads:
t.join()
print ("退出主线程")
以上程序执行结果:
开启线程:Thread-1
开启线程:Thread-2
开启线程:Thread-3
Thread-3 processing One
Thread-1 processing Two
Thread-2 processing Three
Thread-3 processing Four
Thread-1 processing Five
退出线程:Thread-3
退出线程:Thread-2
退出线程:Thread-1
退出主线程