安装GroundingDINO报错一些解决方法

Stable Diffusion中安装GroundingDINO有详细的视频, 具体移步至B站大佬视频:

【【AI绘画】Stable Diffusion强到离谱的插件让商业换装如此简单,Segment Anything GroundingDINO喂饭级安装教程】

文本安装流程对照视频


虽然大佬视频已经足够详细, 但安装GroundingDINO的过程实在是太难, 中间的各种报错很容易让人放弃.其中各种报错代码, 看的人是眼花缭乱。

大佬视频的评论区有大部分的解决方法,但是本人安装过程中报错无数,评论区解决方案虽然有用,但我觉得还不够,以下我补充说明几点:

结合上面视频与文档,基本可以解决大部分报错,如果仍然不能解决,可以尝试思考一下问题:

1.CUDA的安装(注意支持的版本)

        CUDA的安装路径最好不要有中文或者空格,否则会出现很多莫名其妙的错误。其默认是安装在program Files文件夹下的, 而这个文件夹名字细心的会发现,是带有空格的,也是是很多软件的默认安装路径,正是出错的一个原因。

 

        解决方法,可以尝试修改安装路径,注意选择一个不包含中文、空格的文件夹。

对于卸载CUDA重新安装也有讲究,具体查看大佬的文章:

文本安装流程对照视频

2.查看自己计算机名是否含有空格,或者为中文名

        有些文件会用到这个用户目录,默认的用户目录如下(中文的用户两个字不管, 实际为user目录)

 用户文件夹里面就是每个用户的专用文件夹,用来保存当前电脑用户的一些文件,如果你电脑登录的用户名包含空格或者中文,很大几率会有问题,而出错之后你根本找不出是哪里出了问题。修改为没有空格的英文名字一劳永逸。

修改的方法也很简单,不明白的百度搜索即可,但有个坑需要注意,不要用当前用户修改当前用户的用户名和用户文件夹名,如果要修改请先注销当前用户,登录至另一个有管理员权限的账户。避免造成文件读取错误。而且需要注意用户名必须修改成与用户文件夹名一致。

3. python环境或者系统环境问题

        我的解决方案就是,直接安装minicanda虚拟环境,然后在里面安装3.10版本的python,接着按上面的步骤安装即可,因为minicanda环境完全隔离,可以说是非常的纯净,安装编译GroundingDINO更是一路顺畅,一点报错都没有,简直无敌。

因为我用的秋叶启动器+整合包的形式,只需要在秋叶启动器设置自己的python解释器路径即可食用miniconda虚拟环境中的python环境,修改完成后启动启动器会自动安装相关一系列依赖,完全傻瓜化。

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
根据提供的引用内容,Grounding DINO是一种结合了DINO和基于Transformer的检测器的模型,用于开放式目标检测。它的输入是图像和文本,输出是多个[物体框,名词短语]对。具体来说,Grounding DINO使用DINO模型对图像和文本进行编码,然后使用基于Transformer的检测器对编码后的特征进行检测,最终输出[物体框,名词短语]对。 下面是一个简单的示例代码,演示如何使用Grounding DINO进行开放式目标检测: ```python import torch from torchvision.models.detection import fasterrcnn_resnet50_fpn from transformers import ViTFeatureExtractor, ViTForImageClassification from transformers.models.dino.modeling_dino import DINOHead # 加载预训练的DINO模型和ViT模型 dino = ViTForImageClassification.from_pretrained('facebook/dino-vit-base') dino_head = DINOHead(dino.config) dino_head.load_state_dict(torch.load('dino_head.pth')) dino.eval() vit_feature_extractor = ViTFeatureExtractor.from_pretrained('google/vit-base-patch16-224') # 加载预训练的Faster R-CNN检测器 model = fasterrcnn_resnet50_fpn(pretrained=True) model.eval() # 输入图像和文本 image = Image.open('example.jpg') text = 'a person riding a bike' # 对图像和文本进行编码 image_features = vit_feature_extractor(images=image, return_tensors='pt')['pixel_values'] text_features = dino_head.get_text_features(text) image_embedding, text_embedding = dino(image_features, text_features) # 使用Faster R-CNN检测器进行目标检测 outputs = model(image_embedding) boxes = outputs[0]['boxes'] labels = outputs[0]['labels'] # 输出[物体框,名词短语]对 for i in range(len(boxes)): print([boxes[i], labels[i]]) ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值