学习目标
- 了解 Mobile-Agent 框架的基本概念和应用场景。
- 掌握 Mobile-Agent Demo 的搭建和运行流程。
- 实践通过简单的指令让智能体自动控制模拟手机执行操作。
学习步骤
Step 0:申领大模型API
- 访问阿里云百炼平台 (https://bailian.console.aliyun.com/),注册并登录账号。
- 开通 qwen-vl-plus 的限时免费使用额度 100w Token,有效期为 30 天。
Step 1:下载 Android Studio
-
访问 Android Studio 官方网站:https://developer.android.google.cn/studio?hl=zh-cn。
-
下载并安装 Android Studio,注意安装路径。默认路径会在 C 盘,但可以根据需求进行更改。若更改路径,则需同步修改环境变量,以避免报错问题。
- 提示: 若在更改路径和环境变量后仍然出现启动失败的问题(如非ASCII码问题),可能与电脑用户名有关。如果用户名为中文,会导致部分软件出现乱码问题。建议通过 PE 系统(如 FirPE)来修改用户名和注册表信息,以确保兼容性。
Step 2:新建一个虚拟手机
- 在 Android Studio 中创建一个虚拟设备。
- 启动虚拟手机,并将 Google 日历应用移动到桌面。
Step 3:安装 Mobile-Agent 框架
-
使用 VSCode 打开一个新文件夹,并新建一个终端。
-
安装 Git LFS 并克隆 Mobile-Agent Demo 相关文件:
git lfs install
git clone https://www.modelscope.cn/datasets/Datawhale/MobileAgent_V2_Demo_qwenVL.git
cd MobileAgent_V2_Demo_qwenVL
3.使用 Anaconda 创建一个新的 Python 环境,并安装所需的依赖:
conda create -n mobileagent python=3.9.19
conda activate mobileagent
pip install -r win_requirements.txt -i https://mirrors.aliyun.com/pypi/simple
-
提示: 如果网络环境较慢,建议使用镜像源(如阿里云镜像源)加速安装。
-
修改
run.py
文件中的adb_path
和qwen_api
变量:adb_path
设置为本地 adb 工具的实际路径。qwen_api
替换为你在 Step 0 中获得的 API 密钥。
Step 4:体验 Mobile-Agent Demo
- 在终端中执行
python run.py
。 - 观察终端中返回的 Agent 思考和动作记录,验证 Mobile-Agent 是否正常运行。
学习总结
通过此次学习,我成功搭建并运行了 Mobile-Agent Demo,初步了解了如何通过简单的指令控制模拟手机的操作。同时,掌握了基本的环境配置和依赖安装流程,包括应对可能的安装路径问题和中文用户名导致的兼容性问题。未来,我将进一步探索如何扩展和优化 Agent 的行为,以及如何利用 Mobile-Agent 框架开发更复杂的应用。