- 博客(2)
- 收藏
- 关注
原创 利用Blip模型复现vqa
1.从github上下载blip源码2.下载vqav2数据集 https://visualqa.org/download.html将json文件和训练集、测试集、验证集都下载(我是把测试集和验证集的图片都复制到训练集train2014里面了,因为程序报错找不到图片)3.下载Visual Genome数据集 https://homes.cs.washington.edu/~ranjay/visualgenome/api.html我下的是2016年,分为两个部分。
2024-03-28 19:36:28
757
原创 blip模型复现Image-Text Retrieval
1.从github上下载blip源代码2.下载coco训练集,train2014、val2014、test2014(将三个数据集放到一个文件夹,步骤5中需要用到)3.下载预训练模型model_base_retrieval_coco.pth(或者readme里找一下)4.修改train_retrieval.py中的–config ./configs/retrieval_coco.yaml \以及–output_dir output/retrieval_coco。
2024-01-05 09:49:19
821
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人