OmniParser在Windows10上的部署全过程(第一步)

首先说一下我的电脑的配置,按照正常来说Omniparser需要有GPU,但是我的电脑没有GPU,但是经过测试,也可以进行运行

 本文章学习大佬博客才得以完成

本地部署OmniParser微软最强开源屏幕解析模型!最强开源屏幕解析工具,面向纯视觉的GUI代理!实现用户界面截图解析为结构化!结合pyautogui实现自动点击指定元素!#OmniParser (stoeng.site)

一、需要先看一下电脑上有没有安装Anaconda
测试如下:

如果没有的话,需要先进行安装,后边需要用到

具体的安装流程如下:

安装conda搭建python环境(保姆级教程)_conda创建python虚拟环境-CSDN博客


 

安装好了,以后进行测试,检查是否安装好了

二、接下来开始进行环境的配置

首先需要将cmd打开,最好右击用管理员打开

打开以后需要对路径进行更改(最好自己创建一个文件夹)

操作流程        

1、先换一个盘

2、打开到需要进行配置的文件夹    cd  文件夹的名字   ——代表进入文件夹

                                                         cd ..                     ——代表返回上一级目录

3、进入文件夹后,进行环境的配置,输入命令安装python       (OmniParser要求python是3.12版本)(在cmd中输入)

conda create -n omi python=3.12 -y

完成后输入

conda activate omi

如果提示没有Init,按照提示进行Init即可,Init结束后,关闭cmd重新打开(没有提示这个则不用管)

正常如下

4、安装openai(在cmd中输入)

pip install einops timm pillow openai

5安装pytorch(在cmd中输入)

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

6下载源文件

在Github上下载源文件(由于我没有装Git,因此我进行压缩包的下载)

链接https://github.com/microsoft/OmniParser?tab=readme-ov-file

点击download zip,将其下载到上边建立的文件夹中,也就是test文件夹,并进行解压

7、进行requirements.txt文档中的依赖安装(在cmd中输入)

pip install -r requirements.txt

8、接下来需要下载模型文件

下载地址https://huggingface.co/microsoft/OmniParser

由于需要下载的模型很大,这里选择找了一个镜像网站进行下载,速度很快

镜像网站HF-Mirror   在这个里边搜索microsoft/OmniParser

可以看到对应的模型文件

将四个文件夹里边的内容全部下载,并放到weights文件夹中,完成如下

8、我安装的是V1.5版本,到此安装就算结束

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值