在检索过程中,有直接使用训练集中提取特征用于检索,也有将训练集中的数据转化为哈希码用于检索,如果想了解如何将训练集中的数据用于哈希码的可以看我上一篇博客,在那篇博客详细讲述了如何去将训练集的数据转化为哈希码。
下面介绍检索过程中使用训练集的特征来检索的方式。框架分为三个大结构:
1. 网络训练
首先要对原有的主干网络进行训练。只有训练好了网络才能对特征进行有效提取。
2. 获取训练集特征和标签
代码清晰简单,就根据代码与注释即可理解相关内容。
A. 生成训练集特征和标签
B. 累加特征和标签
# 定义空张量存储特征与标签
init_tensor = torch.empty(0,512).to(DEVICE)
init_Target = torch.tensor([]).to(DEVICE)
# 初始化正确值
acc = 0
k = 20
epoch_test = 1
model.to(DEVICE)
model.eval()
# 累加训练张量与标签
with torch.no_grad():
for data, target in train_loader:
data, target = data.to(DEVICE), target.to(DEVICE)
# 获取output值
output = model(data)
init_tensor = torch.cat((init_tensor,output),dim=0)
init_Target = torch.cat((init_Target,target),dim=0)
print("-----------------训练集数据特征和标签累加完毕-----------------")
print("------------开始进行测试,测试使用@TOP",k,"实现检索-------------------")
3. 生成测试集特征并比较
代码清晰简单,就根据代码与注释即可理解相关内容。
A. 获取测试集特征和标签
B. 分每个样本的测试特征与训练集特征进行相似度计算
C. 相似度排序
D. 累加相同标签的相似度
E. 得出预测标签并于真实标签进行比较
# 在测试集中,比较训练集中的生成的特征来实现确定 @K TOP
model.eval()
with torch.no_grad():
for data, target in test_loader:
print("hashTest: ",epoch_test)
data, target = data.to(DEVICE), target.to(DEVICE)
# 获取测试集output值
output = model(data)
# 将测试集的每个样本循环测试一次
for i in range(output.shape[0]):
# 相似度计算
feature_row = output[i, : ]
similarity = F.cosine_similarity(feature_row,init_tensor,dim=1)
# 对相似进行排序,找到前k个值与下标
values, indices = find_topk(similarity,k)
# 对前k个值的数据根据标签进行累加
sum_values = torch.zeros(1,10).to(DEVICE)
for j in indices:
sum_values[0,int(init_Target[j])] = sum_values[0,int(init_Target[j])] + similarity[j]
# 累加后的数据中找到最大值作为预测数据
max_index= torch.argmax(sum_values)
# 如果预测数据准确,就acc++
if max_index == target[i]:
acc = acc + 1
epoch_test = epoch_test + 1
print("Accuracy:",acc,'/',len(test_loader.dataset),' (',float(acc) / len(test_loader.dataset) * 100,'%)')