MCP 客户端开发实战：从协议接入到 LLM 工具调用的全链路解析-CSDN博客

本文链接：https://blog.csdn.net/The_Thieves/article/details/147474261

在开发 AI 应用时，我们常常面临这样的挑战：如何让大语言模型（LLM）高效调用外部工具，同时又不被复杂的底层通信协议束缚？MCP（模型上下文协议）通过标准化的客户端实现，为这个问题提供了优雅的解决方案。今天，我们结合具体代码，深入解析 MCP 客户端的核心实现逻辑，看看如何通过几行关键代码，实现 LLM 与外部工具的无缝协作。

一、客户端架构：分层设计让协议接入更简单

当我们着手开发 MCP 客户端时，首先会遇到一个核心问题：如何处理协议层与应用层的解耦？MCP 的官方客户端库通过清晰的分层架构，帮我们解决了这个难题：

四层架构解析

应用层（MCPClient）：封装业务逻辑，比如对话管理、LLM 集成，直接面向开发者提供简洁的 API
协议层（ClientSession）：实现 MCP 协议核心功能，包括会话初始化、工具调用、能力协商
传输层（stdio_client）：建立底层通信通道，支持标准输入输出（STDIO）或 HTTP 等传输方式
配置层（StdioServerParameters）：管理服务器启动参数，适配不同语言开发的 MCP 服务器（Python/Node.js）

这种分层设计带来的好处是显而易见的：我们在开发业务功能时，无需关心底层协议的细节，只需要调用应用层提供的接口即可。

二、核心代码实现：从连接服务器到工具调用

1. 初始化客户端：建立与 MCP 服务器的连接

python

class MCPClient:
    def __init__(self):
        self.session: Optional[ClientSession] = None  # 存储MCP会话对象
        self.exit_stack = AsyncExitStack()  # 异步资源管理器，确保连接正确关闭
        self.anthropic = Anthropic()  # 初始化Claude模型客户端

    async def connect_to_server(self, server_script_path: str):
        # 验证服务器脚本类型，仅支持Python或Node.js
        is_python = server_script_path.endswith('.py')
        is_js = server_script_path.endswith('.js')
        if not (is_python or is_js):
            raise ValueError("服务器脚本必须是.py或.js文件")
        
        # 创建服务器启动参数，自动根据脚本类型选择执行命令
        command = "python" if is_python else "node"
        server_params = StdioServerParameters(
            command=command,
            args=[server_script_path],
            env=None  # 可在此添加环境变量，如API密钥
        )
        
        # 通过标准输入输出建立通信通道，这是MCP协议的标准传输方式之一
        stdio_transport = await self.exit_stack.enter_async_context(stdio_client(server_params))
        stdio, write = stdio_transport  # 获取输入输出通道
        
        # 初始化MCP会话，自动完成协议握手和能力协商
        self.session = await self.exit_stack.enter_async_context(ClientSession(stdio, write))
        await self.session.initialize()  # 发送初始化请求，获取服务器支持的功能
        
        # 验证连接是否成功，打印可用工具列表
        tool_list = await self.session.list_tools()
        print(f"成功连接到MCP服务器，可用工具：{[tool.name for tool in tool_list.tools]}")

这里的关键是stdio_client和ClientSession的配合：前者负责建立底层的进程间通信通道，后者实现 MCP 协议的核心逻辑。通过AsyncExitStack，我们确保所有异步资源（如网络连接）在程序结束时正确释放，避免资源泄漏。

2. 处理用户查询：LLM 与工具的协同工作流

当用户发送查询时，客户端需要协调 LLM 和 MCP 工具，形成 "推理→工具调用→再推理" 的闭环：

python

async def process_query(self, query: str) -> str:
    messages = [{"role": "user", "content": query}]  # 初始化对话历史
    tool_list = await self.session.list_tools()  # 获取服务器提供的工具列表
    
    # 将工具信息转换为Claude模型所需的格式
    available_tools = [{
        "name": tool.name,
        "description": tool.description,
        "parameters": tool.inputSchema  # JSON Schema定义的参数格式
    } for tool in tool_list.tools]
    
    final_text = []  # 存储最终响应内容
    
    while True:
        # 调用Claude模型，传入当前对话和工具列表
        claude_response = self.anthropic.messages.create(
            model="claude-3-5-sonnet-20241022",
            max_tokens=1000,
            messages=messages,
            tools=available_tools
        )
        
        for content in claude_response.content:
            if content.type == 'text':  # LLM直接返回文本，无需工具调用
                final_text.append(content.text)
            elif content.type == 'tool_use':  # LLM决定调用工具
                tool_name = content.name
                tool_args = content.input  # 工具所需的参数
                
                # 调用MCP服务器的工具，这里会触发协议中的`invoke`方法
                tool_result = await self.session.call_tool(tool_name, tool_args)
                
                # 记录工具调用过程，方便调试和用户反馈
                final_text.append(f"[使用工具 {tool_name} 处理参数：{tool_args}]")
                
                # 更新对话历史，将工具结果作为新输入继续推理
                if content.text:
                    messages.append({"role": "assistant", "content": content.text})
                messages.append({
                    "role": "user", 
                    "content": tool_result.content  # 工具返回的实际数据
                })
            else:
                break  # 处理其他可能的响应类型
        
        # 检查是否需要继续工具调用，这里可以根据业务逻辑添加终止条件
        if not any(c.type == 'tool_use' for c in claude_response.content):
            break
    
    return "\n".join(final_text)  # 合并所有文本段落作为最终响应

这段代码展示了一个典型的工具调用流程：LLM 首先根据用户查询和工具列表，决定是否需要调用外部工具。如果需要，客户端通过call_tool方法触发 MCP 协议的工具调用流程，服务器处理完成后返回结果，再作为新的输入进入 LLM 的推理过程。这种设计让 LLM 能够动态决定何时使用工具，而无需硬编码调用逻辑。