【Python基础结篇】-百万级并发系统案例 - 从架构设计到性能优化(附聊天系统源码)

本文链接：https://blog.csdn.net/wskhechenglong/article/details/147028770

思来想去，觉得还是应该补充一篇并发方面的文章，作为Python基础篇的结篇文章，后续将会分享大家比较关心的关于AI应用开发相关的内容（包括但不限于自然语言处理与应用、Coze智能体创建、RAG应用、Agent开发、多模态应用等等系列文章）
1、首先，本文适合有一定Python开发经验的读者学习，不太适合初学者。
2、其次，这篇文章内容很长，个人精力有限各种架构图和流程图都是简图，没有过多废话，没有过多介绍原理，都是硬核代码内容，认真读完一定会有收获。
3、最后，文末附上一个实现的聊天系统代码，仅供大家学习参考。

高并发架构、Python异步编程、分布式系统、性能优化、WebSocket

1. 百万级并发系统架构设计原则

高并发系统的架构设计是整个系统的基础，一个设计良好的架构能够让系统在面对高并发场景时保持稳定。我在设计某直播平台后台时，就深刻体会到架构设计对系统稳定性的重要性。

1.1 分层架构与松耦合设计思想

传统的单体架构在高并发环境下很容易成为瓶颈。在实践中，我发现将系统划分为多个松耦合的层级是应对高并发的第一步。

# 系统分层示例
class PresentationLayer:
    """处理用户界面和API接口"""
    pass

class BusinessLayer:
    """处理业务逻辑"""
    pass

class DataAccessLayer:
    """负责数据存取"""
    pass

class IntegrationLayer:
    """与外部系统集成"""
    pass

这种分层设计允许我们独立扩展和优化每一层，当某一层面临性能瓶颈时，可以单独对该层进行水平扩展，而不影响其他层级。

在这里插入图片描述

1.2 无状态服务与有状态服务分离策略

在设计高并发系统时，将无状态服务和有状态服务分离是一个关键决策。无状态服务不保存任何会话信息，这使得它们可以轻松扩展。

# 无状态API服务示例
from fastapi import FastAPI

app = FastAPI()

@app.get("/api/user/{user_id}")
async def get_user(user_id: int):
    # 从数据库获取用户信息，不保存状态
    user = await database.get_user(user_id)
    return user

而有状态服务（如数据库、缓存等）则需要特别处理：

# 有状态服务管理
class SessionManager:
    def __init__(self, redis_connection):
        self.redis = redis_connection
    
    async def save_session(self, session_id, data, ttl=3600):
        # 将会话数据存储在Redis中
        await self.redis.set(f"session:{
     session_id}", data, ex=ttl)
    
    async def get_session(self, session_id):
        # 从Redis获取会话数据
        return await self.redis.get(f"session:{
     session_id}")

通过这种分离，我们能够针对不同类型的服务采用不同的扩展和容错策略。

在这里插入图片描述

1.3 异步通信模型与事件驱动设计

在高并发场景下，采用异步通信模型可以大幅提高系统的吞吐量。我在实际项目中发现，Python的asyncio框架配合事件驱动设计是一个非常强大的组合。

import asyncio

class EventDrivenSystem:
    def __init__(self):
        self.subscribers = {
   }
    
    def subscribe(self, event_type, callback):
        if event_type not in self.subscribers:
            self.subscribers[event_type] = []
        self.subscribers[event_type].append(callback)
    
    async def publish(self, event_type, data):
        if event_type in self.subscribers:
            coroutines = [callback(data) for callback in self.subscribers[event_type]]
            await asyncio.gather(*coroutines)

事件驱动设计使系统各组件之间的通信变得非常灵活，同时也降低了组件间的耦合度。

在这里插入图片描述

1.4 负载均衡策略与算法选择

负载均衡是高并发系统的核心机制之一。实际工作中，我经常使用以下几种负载均衡算法：

轮询（Round Robin）：最简单的策略，请求依次分配给后端服务器。
加权轮询（Weighted Round Robin）：根据服务器性能设置权重。
最少连接（Least Connections）：将请求分配给连接数最少的服务器。
IP哈希（IP Hash）：根据客户端IP将请求分配给特定服务器，保证会话一致性。

class LoadBalancer:
    def __init__(self, servers, algorithm='round_robin'):
        self.servers = servers
        self.algorithm = algorithm
        self.current_index = 0
        self.connections = {
   server: 0 for server in servers}
    
    def get_server(self, client_ip=None):
        if self.algorithm == 'round_robin':
            server = self.servers[self.current_index]
            self.current_index = (self.current_index + 1) % len(self.servers)
            return server
        elif self.algorithm == 'least_connections':
            return min(self.connections, key=self.connections.get)
        elif self.algorithm == 'ip_hash' and client_ip:
            index = hash(client_ip) % len(self.servers)
            return self.servers[index]

选择合适的负载均衡策略对于优化系统性能至关重要。在我的实践中，针对不同的服务特性选用不同的算法能够获得最佳效果。

在这里插入图片描述

1.5 服务降级与熔断机制设计

当系统面临极高负载时，服务降级和熔断机制能够确保核心功能的可用性。我在一次直播平台大促活动中就应用了这一机制。

class CircuitBreaker:
    def __init__(self, failure_threshold=5, reset_timeout=30):
        self.failure_count = 0
        self.failure_threshold = failure_threshold
        self.reset_timeout = reset_timeout
        self.state = "CLOSED"  # CLOSED, OPEN, HALF-OPEN
        self.last_failure_time = None
    
    async def execute(self, func, *args, **kwargs):
        if self.state == "OPEN":
            # 检查是否应该进入半开状态
            if (time.time() - self.last_failure_time) > self.reset_timeout:
                self.state = "HALF-OPEN"
            else:
                # 快速失败
                raise Exception("Circuit breaker is open")
        
        try:
            result = await func(*args, **kwargs)
            if self.state == "HALF-OPEN":
                # 恢复到闭合状态
                self.state = "CLOSED"
                self.failure_count = 0
            return result
        except Exception as e:
            self.failure_count += 1
            self.last_failure_time = time.time()
            
            if self.failure_count >= self.failure_threshold:
                self.state = "OPEN"
            
            raise e

熔断器模式可以防止系统级联失败，保护关键服务。在实际应用中，我会为不同的服务设置不同的熔断参数，以平衡可用性和稳定性。

在这里插入图片描述

2. Python高并发技术组合应用

Python在处理高并发任务时有多种技术选择，但如何将这些技术组合起来以达到最佳效果是一门艺术。在实践中，我发现不同并发模型的组合应用比单一技术更能发挥Python的潜力。

2.1 asyncio与uvloop高性能事件循环

asyncio是Python3.4引入的异步编程标准库，而uvloop是其高性能替代方案，基于libuv（Node.js使用的同一个库）实现。在我主导的一个直播平台API服务中，将默认事件循环替换为uvloop使得系统吞吐量提升了近40%。

import asyncio
import uvloop

# 使用uvloop替换默认事件循环
asyncio.set_event_loop_policy(uvloop.EventLoopPolicy())

async def main():
    # 异步应用代码
    await asyncio.gather(
        task1(),
        task2(),
        task3()
    )

if __name__ == "__main__":
    asyncio.run(main())

uvloop的性能提升来自于其C语言实现的事件循环，减少了Python解释器的开销。在高并发系统中，这种微小的优化被放大，带来显著的系统吞吐量提升。

在这里插入图片描述

2.2 多进程与多线程协同工作模式

Python由于GIL（全局解释器锁）的存在，多线程在CPU密集型任务上并不能充分利用多核。而在高并发系统中，我们通常会同时面对IO密集型和CPU密集型任务，因此需要多进程与多线程协同工作。

import concurrent.futures
import multiprocessing
import threading
import asyncio

class HybridConcurrencyExecutor:
    def __init__(self, max_workers_process=None, max_workers_thread=None):
        # 进程池处理CPU密集型任务
        self.process_executor = concurrent.futures.ProcessPoolExecutor(
            max_workers=max_workers_process or multiprocessing.cpu_count()
        )
        # 线程池处理IO密集型任务
        self.thread_executor = concurrent.futures.ThreadPoolExecutor(
            max_workers=max_workers_thread or (multiprocessing.cpu_count() * 5)
        )
    
    async def run_in_process_pool(self, fn, *args, **kwargs):
        loop = asyncio.get_event_loop()
        return await loop.run_in_executor(
            self.process_executor, fn, *args, **kwargs
        )
    
    async def run_in_thread_pool(self, fn, *args, **kwargs):
        loop = asyncio.get_event_loop()
        return await loop.run_in_executor(
            self.thread_executor, fn, *args, **kwargs
        )
    
    async def process_task(self, task_type, task_fn, *args, **kwargs):
        if task_type == 'cpu_bound':
            return await self.run_in_process_pool(task_fn, *args, **kwargs)
        else:  # io_bound
            return await self.run_in_thread_pool(task_fn, *args, **kwargs)
    
    def shutdown(self):
        self.process_executor.shutdown()
        self.thread_executor.shutdown()

在实际项目中，我们会根据任务的特性选择合适的执行方式，CPU密集型任务（如图像处理、数据计算）使用多进程，IO密集型任务（如网络请求、文件读写）使用asyncio或多线程。

在这里插入图片描述

2.3 协程池与进程池动态调度策略

在百万级并发系统中，资源管理至关重要。协程池和进程池的动态调度可以根据系统负载自动调整资源分配。

import asyncio
import aiojobs
import psutil
import time
from concurrent.futures import ProcessPoolExecutor

class DynamicResourceScheduler:
    def __init__(self, min_processes=2, max_processes=None, 
                 min_coroutines=100, max_coroutines=10000):
        # 进程池配置
        self.min_processes = min_processes
        self.max_processes = max_processes or psutil.cpu_count()
        self.current_processes = min_processes
        
        # 协程池配置
        self.min_coroutines = min_coroutines
        self.max_coroutines = max_coroutines
        self.current_coroutines = min_coroutines
        
        # 资源使用监控
        self.cpu_usage_samples = []
        self.memory_usage_samples = []
        self.sample_interval = 5  # 每5秒采样一次
        
        # 初始化进程池和协程调度器
        self.process_pool = ProcessPoolExecutor(max_workers=self.current_processes)
        
    async def initialize_scheduler(self):
        # 初始化协程调度器
        self.scheduler = await aiojobs.create_scheduler(
            limit=self.current_coroutines,
            pending_limit=self.current_coroutines * 2
        )
        
        # 启动资源监控任务
        asyncio.create_task(self._monitor_resources())
        
    async def _monitor_resources(self):
        """监控系统资源使用情况并动态调整资源分配"""
        while True:
            # 采集CPU和内存使用率
            cpu_percent = psutil.cpu_percent(interval=1)
            memory_percent = psutil.virtual_memory().percent
            
            self.cpu_usage_samples.append(cpu_percent)
            self.memory_usage_samples.append(memory_percent)
            
            # 保留最近10个样本
            if len(self.cpu_usage_samples) > 10:
                self.cpu_usage_samples.pop(0)
                self.memory_usage_samples.pop(0)
            
            # 计算平均值
            avg_cpu = sum(self.cpu_usage_samples) / len(self.cpu_usage_samples)
            avg_memory = sum(self.memory_usage_samples) / len(self.memory_usage_samples)
            
            # 根据资源使用情况调整进程池和协程池大小
            await self._adjust_resources(avg_cpu, avg_memory)
            
            await asyncio.sleep(self.sample_interval)
    
    async def _adjust_resources(self, cpu_usage, memory_usage):
        """根据CPU和内存使用率调整资源分配"""
        # 调整进程池大小
        if cpu_usage > 80 and self.current_processes < self.max_processes:
            # CPU使用率高，增加进程数
            self.current_processes = min(self.current_processes + 1, self.max_processes)
            self._recreate_process_pool()
        elif cpu_usage < 30 and self.current_processes > self.min_processes:
            # CPU使用率低，减少进程数
            self.current_processes = max(self.current_processes - 1, self.min_processes)
            self._recreate_process_pool()
        
        # 调整协程池大小
        if memory_usage < 70:
            # 内存充足，可以增加协程数
            new_limit = min(int(self.current_coroutines * 1.2), self.max_coroutines)
            if new_limit > self.current_coroutines:
                self.current_coroutines = new_limit
                await self.scheduler.close()
                self.scheduler = await aiojobs.create_scheduler(
                    limit=self.current_coroutines,
                    pending_limit=self.current_coroutines * 2
                )
        elif memory_usage > 85:
            # 内存紧张，减少协程数
            new_limit = max(int(self.current_coroutines * 0.8), self.min_coroutines)
            if new_limit < self.current_coroutines:
                self.current_coroutines = new_limit
                await self.scheduler.close()
                self.scheduler = await aiojobs.create_scheduler(
                    limit=self.current_coroutines,
                    pending_limit=self.current_coroutines * 2
                )
    
    def _recreate_process_pool(self):
        """重新创建进程池"""
        old_pool = self.process_pool
        self.process_pool = ProcessPoolExecutor(max_workers=self.current_processes)
        old_pool.shutdown(wait=False)
    
    async def submit_task(self, task_type, func, *args, **kwargs):
        """提交任务到合适的执行器"""
        if task_type == 'cpu_bound':
            loop = asyncio.get_event_loop()
            return await loop.run_in_executor(
                self.process_pool, func, *args, **kwargs
            )
        else:  # io_bound or mixed
            return await self.scheduler.spawn(func(*args, **kwargs))

这种动态调度策略能够根据系统负载自动调整资源分配，在保证系统稳定性的同时最大化资源利用率。在我参与的一个金融数据分析平台中，这种策略使得系统在高峰期仍然能够保持稳定的响应时间。

在这里插入图片描述

2.4 异步IO与零拷贝技术结合

在高并发系统中，数据传输的效率直接影响系统的整体性能。Python的异步IO结合操作系统提供的零拷贝技术可以大幅提升数据传输效率。

import asyncio
import os
import socket
import mmap
from pathlib import Path

class ZeroCopyFileTransfer:
    def __init__(self, host='0.0.0.0', port=8888):
        self.host = host
        self.port = port
        self.loop = asyncio.get_event_loop()
    
    async def start_server(self):
        """启动文件传输服务器"""
        server = await asyncio.start_server(
            self.handle_client, self.host, self.port
        )
        async with server:
            await server.serve_forever()
    
    async def handle_client(self, reader, writer):
        """处理客户端连接"""
        addr = writer.get_extra_info('peername')
        print(f"客户端连接: {
     addr}")
        
        # 接收文件请求
        file_path_data = await reader.read(1024)
        file_path = file_path_data.decode().strip()
        
        if not os.path.exists(file_path):
            writer.write(b"文件不存在")
            await writer.drain()
            writer.close()
            return
        
        # 获取文件大小
        file_size = os.path.getsize(file_path)
        writer.write(f"{
     file_size}".encode())
        await writer.drain()
        
        # 获取客户端socket连接
        client_socket = writer.get_extra_info('socket')
        
        # 使用零拷贝技术传输文件
        try:
            await self.send_file_with_zero_copy(file_path, client_socket)
        except Exception as e:
            print(f"传输错误: {
     e}")
        finally:
            writer.close()
    
    async def send_file_with_zero_copy(self, file_path, sock):
        """使用零拷贝技术发送文件"""
        file_size = os.path.getsize(file_path)
        
        with open(file_path, 'rb') as f:
            # 创建内存映射
            mapped = mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_READ)
            
            # 使用sendfile系统调用进行零拷贝传输
            # 注意：在Python中，我们通过socket.sendfile来使用操作系统的sendfile系统调用
            
            # 将socket设置为非阻塞模式
            sock.setblocking(False)
            
            sent = 0
            while sent < file_size:
                try:
                    # 使用异步版本的sendfile
                    fut = self.loop.sock_sendfile(sock, f.fileno(), sent, file_size - sent)
                    sent_bytes = await fut
                    if sent_bytes == 0:  # 连接已关闭
                        break
                    sent += sent_bytes
                except (BlockingIOError, InterruptedError):
                    # 资源暂时不可用，等待一下
                    await asyncio.sleep(0.01)
            
            mapped.close()

在实际应用中，零拷贝技术能够显著减少数据传输过程中的CPU消耗和内存占用，特别适合需要大量文件传输的场景，如视频流媒体、文件下载服务等。

在这里插入图片描述

2.5 非阻塞网络编程模型实现

非阻塞网络编程是高并发系统的基础。在Python中，我们可以结合asyncio和底层socket API实现高效的非阻塞网络编程模型。

import asyncio
import socket
from enum import Enum

class ProtocolState(Enum):
    HEADER = 0
    PAYLOAD = 1
    COMPLETE = 2

class MessageHeader:
    def __init__(self):
        self.msg_type = 0
        self.msg_length = 0
    
    @classmethod
    def from_bytes(cls, data):
        header = cls()
        header.msg_type, header.msg_length = data[0], int.from_bytes(data[1:5], 'big')
        return header

class NonBlockingServer:
    def __init__(self, host='0.0.0.0', port=8000):
        self.host = host
        self.port = port
        self.loop = asyncio.get_event_loop()
        self.clients = {
   }  # 客户端连接状态
    
    async def start_server(self):
        """启动非阻塞网络服务器"""
        server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR,