记录一下如何得到NUS-WIDE数据集的前10/21个样本数量最多的类的数据集的过程及思路。
最大21个类为(前为类别,后为该类别样本数):
TC-21: {'animal': 33887, 'beach': 5239, 'buildings': 17835, 'clouds': 54087, 'flowers': 8605, 'grass': 22561, 'lake': 13392, 'mountain': 5099, 'ocean': 11307, 'person': 51577, 'plants': 14345, 'reflection': 7875, 'road': 9524, 'rocks': 6327, 'sky': 74190, 'snow': 5404, 'sunset': 8418, 'tree': 5352, 'vehicle': 6099, 'water': 35264, 'window': 15051}
最大10个类为:
TC-10: {'animal': 33887, 'buildings': 17835, 'clouds': 54087, 'grass': 22561, 'lake': 13392, 'person': 51577, 'plants': 14345, 'sky': 74190, 'water': 35264, 'window': 15051}
图片数据集下载参考: