模型上下文协议(MCP)：让AI真正_看见_互联网世界_mcp(大模型上下文协议)应用案例-CSDN博客

本文链接：https://blog.csdn.net/qq_42944740/article/details/146385320

在人工智能飞速发展的今天，大语言模型(LLM)如Claude、GPT等已经展现出惊人的能力。但你是否好奇过：当你让AI助手帮你分析一个网页内容，或者查看你的文档时，它是如何做到的？今天，我们就来揭秘背后的技术——模型上下文协议(Model Context Protocol，简称MCP)。

AI的"感官系统"：为什么需要MCP？

想象一下，如果我们的大脑很聪明，但没有眼睛、耳朵这些感官器官，我们将无法感知外部世界。同样，大语言模型虽然拥有强大的理解和生成能力，但它们本身并不能直接"看到"互联网上的内容，也不能直接读取你电脑上的文件。

这就是MCP存在的价值——它就像是AI的"感官系统"，让AI能够获取各种信息来源的数据，从而基于这些实时信息为用户提供服务。

MCP是什么？通俗解释

如果用一个比喻来解释，MCP就像是人工智能世界的"万能转换插头"：

没有MCP之前：每个AI应用都需要开发自己的方式来连接不同的数据源。就像你出国旅行时，需要携带不同国家的电源转换插头一样麻烦。
有了MCP之后：所有数据源都使用同一种标准化的"接口"，AI应用只需实现一次MCP客户端，就能连接所有兼容MCP的数据源。就像有了一个万能转换插头，走到哪里都能用。

更加直白的解释：

MCP就是AI大模型的标准化工具箱。大模型可以利用这些工具与外界互动获取信息，并且完成具体任务。

在我们日常工作中，经常性的与浏览器、文件、数据库、代码、仓库等等的外部工具打交道。我们经常需要手动地去截图或者复制文本，然后把它粘贴到AI客户端的对话窗口中，再去进行对话。

而 MCP 则通过这种标准化的协议方式，将这一步骤进行了自动化。MCP 作为 AI 与外部工具的中间层，代替复杂的人工操作步骤去访问和操作外部工具。

MCP架构：核心组件

MCP采用客户端-服务器架构，主要包括以下核心组件：

MCP主机：需要获取外部数据的AI应用程序（如Claude Desktop）
MCP客户端：在AI应用内集成的组件，负责按照MCP协议发送请求
MCP服务器：接收请求并执行实际操作的程序（如Fetch服务器）
数据源：实际的信息来源（网页、文件、数据库等）

这种架构设计的优势在于：

模块化：各组件职责清晰，可以独立开发和维护
可扩展性：新的数据源只需实现MCP服务器接口即可接入
标准化：所有交互都遵循统一的协议规范

MCP的通信机制

MCP定义了两种默认标准传输机制：

stdio（标准输入输出）：适用于本地通信，客户端与服务端在同一台机器上。
- 客户端通过启动服务端子进程，利用操作系统的管道机制（stdin/stdout）进行数据传输。
- 是个同步阻塞模型，通信基于顺序处理，适合简单的本地批处理任务。
HTTP with SSE（Server-Sent Events）：适用于远程通信，客户端与服务端可部署在不同节点。
- 客户端通过HTTP POST发送请求，服务端通过SSE长连接主动推送数据。
- 是个异步事件驱动模型，支持实时或准实时交互，适合分布式系统或需要高并发的场景。

下面是MCP通信机制的可视化表示：

以下是一个典型的请求-响应交互：

这个图表展示了MCP客户端和服务器之间的JSON-RPC 2.0消息格式，包括请求和可能的响应类型。

MCP的工作流程是怎样的？

MCP的工作流程基于Plan+Execute架构，主要包含四个关键步骤：

资源整合（Resource Integration）：MCP client提供整体workflow流程，获取用户query后开始执行，通过MCP协议把上下文context、memory、data、tool等提供给模型进行调用。
规划（Planning）：大模型基于上下文和query指定操作方案，包括工具选择和数据访问等。
执行（Execute）：client将模型生成的plan发送给对应的server进行解析、执行，得到结果返回给client。
推理（Reasoning）：基于执行的返回结果继续生成完整回答，返回到client展示给用户。

下面是MCP工作流程的详细时序图：

实战案例：MCP Fetch服务器如何获取网页内容

让我们通过一个具体例子来理解MCP的工作流程。假设你让Claude帮你获取某个网站的内容：

步骤1：用户发起请求

你在Claude Desktop中输入：

"请帮我获取https://example.com的内容"

步骤2：识别需求并准备请求

Claude识别出这是一个需要获取网页内容的请求，它的MCP客户端会构建一个标准格式的请求：

{
  "requestId": "req-123456",
  "resourceType": "webContent",
  "parameters": {
    "url": "https://example.com",
    "extractText": true,
    "includeMetadata": true,
    "maxLength": 10000
  }
}

这个请求清晰地表明了需要什么资源（网页内容）、从哪里获取（example.com）以及如何处理（提取文本、包含元数据等）。

步骤3：MCP Fetch服务器处理请求

Fetch服务器收到请求后，会执行以下操作：

验证请求：检查请求格式是否符合规范，以及是否有权限访问请求的资源
资源获取：服务器向example.com发送HTTP GET请求
内容处理：
- 接收HTML响应
- 从HTML中提取纯文本（移除HTML标签、脚本等）
- 提取元数据（如标题、描述、最后修改时间等）
- 对内容进行格式化处理，以便AI更好地理解

步骤4：返回处理结果

处理完成后，Fetch服务器将结果打包成标准MCP响应格式：

{
  "requestId": "req-123456",
  "status": "success",
  "resource": {
    "content": "Example Domain\nThis domain is established to be used for illustrative examples in documents...",
    "metadata": {
      "title": "Example Domain",
      "url": "https://example.com",
      "contentType": "text/html",
      "lastModified": "2025-02-15T10:30:45Z",
      "size": 1256
    },
    "format": "text"
  }
}