论文阅读笔记在笔记本上,整体流程在笔记本上做推导,不在电子版存稿了。较为简单。
数据加载:
我设置5-way-5-shot.
pid2name:描述了relation的name和relation description。
报错提示:显卡不够。
我感觉,作者在fewrel数据集上做的实验,更多是为了测试领域迁移下 ,模型的性能。
在一些其他小样本数据集上的实验,可能是真的N -way-k-shot,和fewrel数据集还是有较大不同的```
然后降低了实验数据量,在实验设置中,将以下参数做出调整为:
```c
parser.add_argument('--trainN', default=1, type=int,
help='N in train')#10
parser.add_argument('--N', default=5, type=int,
help='N way')
parser.add_argument('--K', default=1, type=int,
help='K shot')
parser.add_argument('--Q', default=1, type=int,
help='Num of query per class')#5
实验结果
实验结果记录如下:
step: 2000 | loss: 0.313262, accuracy: 100.00%
Use val dataset
[EVAL] step: 1000 | accuracy: 43.38%
Best checkpoint
step: 4000 | loss: 0.313262, accuracy: 100.00%
Use val dataset
[EVAL] step: 1000 | accuracy: 37.33%
step: 6000 | loss: 0.313262, accuracy: 100.00%
Use val dataset
[EVAL] step: 1000 | accuracy: 34.91%
step: 8000 | loss: 0.313262, accuracy: 100.00%
Use val dataset
[EVAL] step: 1000 | accuracy: 35.69%
step: 10000 | loss: 0.313262, accuracy: 100.00%
Use val dataset
[EVAL] step: 1000 | accuracy: 39.12%
step: 12000 | loss: 0.313262, accuracy: 100.00%
可以明显观察到的是,loss没有在下降。对于实验结果,我持一定的怀疑态度,但作者在git中又给出了训练好的模型。这,,让我,还是有点怀疑…