项目场景:
使用BLIP-2,对图片进行caption。
问题描述
按照model card上的描述执行:
# pip install accelerate
import torch
import requests
from PIL import Image
from transformers import Blip2Processor, Blip2ForConditionalGeneration
processor = Blip2Processor.from_pretrained("Salesforce/blip2-flan-t5-xxl")
model