1 blip细节
2 blip读取代码
if __name__ == '__main__':
args = parse_args()
blix_list = []
img_list = []
for file_name in os.listdir(args.dataset_dir):
if file_name.endswith(".txt"):
continue
img_list.append(file_name)
if args.blip_type == "in_one_txt":
import pdb
pdb.set_trace()
file = open(args.blip_path, "r") # xxx/blip.txt
tmp = file.readlines()
k_v = {}
for i in tmp:
t = i.replace('\n', '').split('|')
k_v[t[0]] = t[1]
for i in img_list:
import pdb
# pdb.set_trace()
blix_list.append(k_v[i])
0 首先看args.dataset_dir就是数据集位置,里面有blip.txt文件
然后如果是txt结尾就跳过
如果是png jpg就留下
这里可以做如下改进
for file_name in os.listdir(args.dataset_dir):
if file_name.endswith(".txt"):
continue
if file_name.endswith(".png") of file_name.endswith(".jpg"):
img_list.append(file_name)
因此img_list是所有非txt结尾文件名!!!
1 args.blip_path
/share/huanggao/zjc/code_mid/data/test_data/blip.txt'
2 tmp是列表
3 for i in tmp
'0726_yitian_diffusion_sketch_9.jpg|a woman posing for the camera\n'
4 以|分割str
t[0]
'0726_yitian_diffusion_sketch_9.jpg'
t[1]
'a woman posing for the camera'
5 k_v[t[0]] = t[1] 构成字典
6 img_list里面是所有图片名