CelebA
数据集主页:link
CelebA
├─Img
│ ├─img_celeba.7z(分卷7z.001~7z.014)
│ └─img_align_celeba.zip
├─Eval
│ └─list_eval_partition.txt
├─Anno
│ ├─list_landmarks_celeba.txt
│ ├─list_landmarks_align_celeba.txt
│ ├─list_bbox_celeba.txt
│ ├─list_attr_celeba.txt
│ └─identity_CelebA.txt
└─readme.txt
图像共202599幅,编号000001.jpg~202599.jpg
原始图像的尺寸各异
list_landmarks_celeba.txt共202601行,存放5个关键点坐标
文件内容如下所示
202599
lefteye_x lefteye_y righteye_x righteye_y nose_x nose_y leftmouth_x leftmouth_y rightmouth_x rightmouth_y
000001.jpg 165 184 244 176 196 249 194 271 266 260
000002.jpg 140 204 220 204 168 254 146 289 226 289
000003.jpg 244 104 264 105 263 121 235 134 251 140
000004.jpg 796 539 984 539 930 687 762 756 915 756
......
202597.jpg 81 121 113 120 101 142 81 155 116 155
202598.jpg 223 73 255 72 241 94 225 108 254 105
202599.jpg 156 191 226 175 189 226 185 252 232 244
# 读取代码
csv_path = 'list_landmarks_celeba.txt'
df = pd.read_csv(csv_path, skiprows=2, header=None, sep='\\s+')
col_five_pts = ['lefteye_x', 'lefteye_y', 'righteye_x', 'righteye_y', 'nose_x', 'nose_y', 'leftmouth_x', 'leftmouth_y', 'rightmouth_x', 'rightmouth_y']
df.columns = ['img_name'] + col_five_pts
VGGFace2
train_list.txt,共3141890行
test_list.txt 共169396行
train文件夹里,n000002~n009279,共8631个文件夹
test文件夹里,n000001~n009294,共500个文件夹