Windows-MCP:让AI直接操作你的Windows系统

什么是Windows-MCP?

Windows-MCP 是一个轻量级的开源项目,它作为MCP(Model Context Protocol)服务器,在AI代理和Windows操作系统之间架起了一座桥梁。通过这个工具,AI代理可以直接与Windows系统交互,执行各种自动化任务。

演示视频

核心特性

🎯 无缝Windows集成

  • • 与Windows UI元素原生交互

  • • 打开应用程序、控制窗口

  • • 模拟用户输入操作

  • • 支持文件导航和管理

🤖 支持任意LLM

与许多自动化工具不同,Windows-MCP不依赖传统的计算机视觉技术或特定的微调模型。它可以使用任何LLM,降低了复杂性和设置时间。

🛠️ 丰富的UI自动化工具集

  • • 基础键盘和鼠标操作

  • • 窗口/UI状态捕获

  • • 实时交互(典型延迟0.7-2.5秒)

🔧 轻量级和可扩展

  • • 最小依赖

  • • 易于设置

  • • 完全开源(MIT许可证)

  • • 可根据需求自定义和扩展

支持的MCP工具

Windows-MCP提供了以下工具来与Windows交互:

  • • Click-Tool: 在指定坐标点击屏幕

  • • Type-Tool: 在元素上输入文本(可选择清除现有文本)

  • • Clipboard-Tool: 使用系统剪贴板复制或粘贴

  • • Scroll-Tool: 在窗口或特定区域垂直或水平滚动

  • • Drag-Tool: 从一个点拖拽到另一个点

  • • Move-Tool: 移动鼠标指针

  • • Shortcut-Tool: 按下键盘快捷键(Ctrl+c、Alt+Tab等)

  • • Key-Tool: 按下单个键

  • • Wait-Tool: 暂停指定时间

  • • State-Tool: 获取默认语言、浏览器、活动应用程序和交互式、文本和可滚动元素的组合快照,以及桌面截图

  • • Resize-Tool: 更改应用程序的窗口大小或位置

  • • Launch-Tool: 从开始菜单启动应用程序

  • • Shell-Tool: 执行PowerShell命令

  • • Scrape-Tool: 抓取整个网页信息

系统要求

前置条件

  • • Python 3.13+

  • • Anthropic Claude Desktop应用或其他MCP客户端

  • • UV(包管理器),通过pip install uv安装

  • • DXT(桌面扩展),通过npm install -g @anthropic-ai/dxt安装

  • • Windows默认语言为英语,或禁用MCP服务器中的Launch-Tool和Resize-Tool

快速开始

Gemini CLI集成

  1. 1. 在文件资源管理器中导航到%USERPROFILE%/.gemini并打开settings.json

  2. 2. 在settings.json中添加windows-mcp配置并保存:

{
  "theme":"Default",
"mcpServers":{
    "windows-mcp":{
      "command":"uv",
      "args":[
        "--directory",
        "<windows-mcp目录的路径>",
        "run",
        "main.py"
      ]
    }
}
}
  1. 3. 在终端中重新运行Gemini CLI,开始使用!

Claude Desktop集成

  1. 1. 克隆仓库:

git clone https://github.com/CursorTouch/Windows-MCP.git
cd Windows-MCP
  1. 2. 构建桌面扩展DXT:

npx @anthropic-ai/dxt pack
  1. 3. 打开Claude Desktop:

  • • 进入设置 -> 扩展 -> 安装扩展(定位.dxt文件)-> 安装

实际应用场景

自动化测试

  • • 应用程序UI测试

  • • 功能验证

  • • 回归测试

工作流程自动化

  • • 文件处理

  • • 应用程序操作

  • • 数据录入

远程控制

  • • 通过SSH远程操作电脑

  • • 移动设备控制桌面

  • • 跨平台任务执行

注意事项

⚠️ 安全提醒

此MCP直接与Windows操作系统交互以执行操作。请谨慎使用,避免在无法承受此类风险的环境中部署。

📝 当前限制

  • • 在段落中选择特定文本部分(正在开发中)

  • • Type-Tool主要用于输入文本,不适合在IDE中编程(正在开发中)

相关资源

  • • Windows-MCP GitHub仓库[1]

  • • MCP官方文档[2]

  • • Claude Desktop集成指南[3]

项目信息

项目名称

Windows-MCP

开源协议

MIT License

GitHub Stars

2k+

项目地址

https://github.com/CursorTouch/Windows-MCP

所属公司

CursorTouch

支持系统

Windows 7/8/8.1/10/11

编程语言

Python

引用链接

[1] Windows-MCP GitHub仓库: https://github.com/CursorTouch/Windows-MCP
[2] MCP官方文档: https://modelcontextprotocol.io/
[3] Claude Desktop集成指南: https://docs.anthropic.com/claude/docs/claude-desktop-extensions

部署 **Windows-MCP** 是一项相对简单但技术性较强的任务,适合希望将 AI 代理集成到 Windows 桌面环境中的开发者。以下是部署 Windows-MCP 的基本步骤和注意事项: ### 1. 环境准备 确保本地系统满足以下条件: - 操作系统Windows 10 或 Windows 11(支持大多数现代 Windows 功能) - Python:安装 Python 3.9 或更高版本,建议使用虚拟环境(如 `venv` 或 `conda`)来管理依赖项 - Git:用于克隆项目仓库到本地 ### 2. 获取项目源码 使用 Git 克隆 Windows-MCP 的开源仓库。打开命令行工具并执行以下命令: ```bash git clone https://github.com/andanteyk/Windows-MCP.git cd Windows-MCP ``` ### 3. 安装依赖项 进入项目目录后,安装所需的 Python 包: ```bash pip install -r requirements.txt ``` 该项目的依赖项较少,符合其“零依赖”的设计理念,因此部署过程更加轻便[^1]。 ### 4. 配置上下文提供程序(Context Providers) Windows-MCP 使用 **上下文提供程序** 来定义 AI 代理可以操作系统功能。开发者可以根据需求启用或自定义这些提供程序。例如: - 文件系统操作(读写文件、目录管理) - 应用控制(启动、关闭、交互应用程序) - UI 自动化(模拟点击、输入等操作) 配置文件通常位于 `config/` 目录下,开发者可以根据需求修改 JSON 配置文件来启用或禁用特定的功能模块[^4]。 ### 5. 启动 MCP 服务器 在项目目录下运行启动脚本,启动 MCP 服务器: ```bash python server.py ``` 服务器启动后,会监听指定端口(默认为 `8000`),等待 AI 代理的连接请求。开发者可以通过日志信息确认服务器是否正常运行。 ### 6. 连接 AI 代理 配置 AI 代理以连接 MCP 服务器。代理需要支持 Model Control Protocol 并能够通过 HTTP 或 WebSocket 与服务器通信。开发者可以参考项目文档中的 API 接口定义,实现自定义的 AI 代理集成。 ### 7. 测试与调试 启动 MCP 服务器并与 AI 代理连接后,开发者可以尝试发送自然语言指令,例如“打开记事本”或“创建一个新文件夹”。系统会将这些指令编译为 Windows API 调用,并执行相应操作[^3]。 ### 8. 自定义与扩展 由于 Windows-MCP 是开源项目(MIT 许可证),开发者可以根据具体需求进行扩展。例如: - 添加新的上下文提供程序以支持特定应用程序 - 优化性能以进一步降低操作延迟 - 集成到现有的自动化测试或办公自动化系统中[^2] ### 9. 部署注意事项 - **安全性**:确保 MCP 服务器仅在受信任的网络环境中运行,避免未经授权的访问。 - **兼容性**:虽然 Windows-MCP 具有高兼容性,但在不同版本的 Windows 上运行时仍需进行充分测试。 - **性能优化**:根据实际应用场景调整配置,以达到最佳的响应速度和资源利用率[^3]。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值