Open-Vocabulary SAM本地部署运行

Open-Vocabulary SAM,简称ovsam,项目对应论文:Open-Vocabulary SAM: Segment and Recognize Twenty-thousand Classes Interactively。该项目提供了在线使用的demo,也可以下载后本地运行。本文介绍ovsam本地部署运行。

一、项目下载

下载地址:GitHub - OpenXLab-APP/ovsam

注意!不要在论文中给的地址下载,内容不全,只能用来看参考文档。文档中给的地址是

https://huggingface.co/spaces/HarborYuan/ovsam ovsam_demo

这个地址经常被墙,不能直接用git拉取,也没有像github一样提供网站内一键下载的按钮。在github上搜索ovsam就能看到上述我成功下载项目的地址。

二、环境配置

用pycharm打开项目并创建conda环境

下载需要的库,可以参考文档给的python命令

python -m pip install gradio==4.7.1
python -m pip install -r requirements.txt

这里我用的是python3.8,torch和mmcv用的是CPU版,其他库的版本最好要按照requirements.txt来下载。如果电脑上安装了cuda也可以用GPU运行,只不过会麻烦一点。此处有三个问题需要注意:

1.如果在下载时遇到了ssh error或是编号为443的错误,大概率是在使用国内源的同时用了科学上网软件,可以尝试关掉软件重新下载,我用的是国内清华源。(然而访问huggingface又必须开软件,没办法,只好反复横跳)

2.库的版本号要对应。例如,torch==2.1.2可以对应torchvision==0.16.2,torchaudio==2.1.2。numpy==1.20.3可以对应pandas==2.0.3。对应关系不止一种,大家可以自行上网搜索。

3.如果遇到错误

ERROR: Could not build wheels for mmcv, which is required to install pyproject.toml-based projects

或者

ImportError: DLL load failed while importing _ext: 找不到指定的模块

大概率是你的mmcv安装有问题,在官网可以根据自己的电脑配置(一定要看清楚!)用对应的命令下载mmcv

官网地址:https://mmcv.readthedocs.io/zh-cn/latest/get_started/installation.html#pip

也可以参考这篇博客

https://blog.csdn.net/m0_73914600/article/details/127176961

三、项目运行

按照文档到这里我们就可以直接运行main.py成功启动项目了,然而事实并不是这样...我们还要对项目进行少许修改

1.直接运行会遇到类似于这样的错误(忘记截图了)

找不到路径:output='/home/xlab-app-center/models'

这是由于output路径必须是本地路径,我们把这一行,即main.py第14行注释掉

download(model_repo='openxlab-app/ovsam', model_name='sam2clip_vith_rn50.pth',output='/home/xlab-app-center/models')

换成

download(model_repo='openxlab-app/ovsam', model_name='sam2clip_vith_rn50.pth',output='models')

2.我们还会遇到第二个问题

BadGzipFile: Not a gzipped file (b‘ve‘)

这个问题通常和.gz后缀的压缩文件有关,经过排查,我发现项目里有一个压缩文件是损坏的,即ext/open_clip/bpe_simple_vocab_16e6.txt.gz。不过还好项目根目录下还有一个同名文件,我们用这个文件替换损坏的文件。

3.到这里会看到一个进度条,我们已经胜利在望了

但是我们仍有可能遇到以下错误

PytorchStreamReader failed reading zip archive: failed finding central 

这个错误通常发生在模型文件被损坏或不完整的情况下,我们观察到项目需要在https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth  

下载模型文件sam_vit_h_4b8939.pth​​​​​​​ 到 C:\Users\你的用户名\.cache\torch\hub\checkpoints 中。

这个模型文件大小为2.4G,如果你发现你的这个模型文件太小,那么就是在下载过程中出现问题导致文件损坏,需要手动下载并放到指定目录中。

四、效果展示

项目提示,在浏览器打开 http://127.0.0.1:7860

运行成功,效果和在线demo一样。用box prompt分割出人的图像,并给出预测label:person,预测分数0.78.

  • 21
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
### 回答1: 通过下载 youmi-vocabulary 背单词微信小程序的代码和相关资源文件后,我们可以直接进行设定和定制。 首先,我们可以打开代码文件,然后根据自己的需求对页面布局、颜色、字体等进行修改。如果想要增加新的功能或者修改现有功能,可以找到相应的代码文件进行编辑,如卡片的显示、单词的存储和读取等。 在设定过程中,我们可以对小程序的首页进行设置,比如添加背景图片、修改标题、调整按钮位置等。另外,我们还可以设定各个页面间的跳转关系,如单词卡片页面跳转到单词详情页面、单词详情页面跳转到例句页面等。对于每个页面的样式和交互,可以通过修改代码中的CSS样式和JavaScript代码来实现。 如果想要添加新的单词库或者词典,我们可以在资源文件中添加相应的文件,然后在代码中引用这些文件,以便在小程序中使用。同时,我们还可以根据需要对单词库进行编辑,如添加新的单词、修改释义或者例句等。 在完成设定后,我们可以运行小程序进行调试,检查是否有错误或者不符合预期的地方。如果发现问题,可以根据提示进行修改,直到满足我们的需求为止。 最后,将修改后的代码和资源文件上传到微信小程序开发者工具中,进行编译和发布,即可在微信中使用我们自己定制的 youmi-vocabulary 背单词微信小程序了。 ### 回答2: youmi-vocabulary 背单词微信小程序是一个用于帮助用户背单词的工具。用户只需要将代码及相关资源文件下载后,可以直接设定并使用该小程序。 首先,将代码及相关资源文件下载到本地。可以通过下载链接或者将代码拷贝到本地的方式进行下载。下载完成后,可以将代码放置在合适的位置。 接下来,设定该微信小程序。打开微信开发者工具,选择该项目所在的文件夹,即可进行设定。在设定过程中,可以配置小程序的基本信息、界面设计、功能模块等,以及与服务器的连接方式等。 一旦设定完成,就可以使用该小程序了。用户可以通过微信扫描小程序二维码,或者在微信搜索框中搜索小程序名称,进入小程序页面。在小程序页面上,用户可以进行单词背诵、词义理解、例句听写等功能。小程序会根据用户设定的英语水平、背诵计划等提供个性化的背单词内容和学习进度统计。 此外,youmi-vocabulary 还提供了一些其他功能,例如字典查询、记忆曲线、背单词游戏等,以提高用户的学习效果和学习兴趣。 总结来说,youmi-vocabulary 背单词微信小程序是一个方便用户背单词的工具。用户只需要下载代码及相关资源文件,并进行设定,就可以使用该小程序,并享受它提供的个性化背单词功能和其他学习辅助功能。 ### 回答3: youmi-vocabulary 背单词微信小程序是一个帮助用户背诵并记忆单词的工具。用户可以在微信小程序上下载该小程序的代码和相关资源文件,并进行设置,以便使用该小程序。 通过下载 youmi-vocabulary 背单词微信小程序的代码和资源文件,用户可以获得小程序的完整功能并进行自定义设置。这些代码和资源文件可能包括小程序的前端代码、后端代码、配置文件、图片等。用户可以根据自己的需求修改这些文件,例如更改小程序的界面样式、增加新的功能、调整单词库等。 在设定时,用户可以根据自己的需求进行个性化设置。例如,用户可以选择自己所需的单词库,根据自己的学习进度和水平设定背诵计划,并进行记忆方面的设置,如背单词的方式(英译汉、汉译英、听力等),记忆模式(选择题、填空题等),以及复习频率等。 通过设定,youmi-vocabulary 背单词微信小程序可以根据用户的需求和设置,在背诵单词的过程中提供个性化的学习体验。用户可以根据自己的设定,系统自动提供对应的背诵任务和学习资料,帮助用户高效、有序地记忆单词。同时,用户也可以根据自己的学习情况进行实时调整和优化设定,以达到最佳学习效果。 总之,通过下载 youmi-vocabulary 背单词微信小程序的代码和相关资源文件,并进行设定,用户可以个性化地使用这个小程序,高效记忆单词,提升自己的语言能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值