上周解决完那个词袋的问题后,存在中间生成文件与索引对应不齐的问题。
这里生成的中间文件val_dataset是240----300对应act_index, 但索引是读入时默认建立的,是从0到299,而不是按照file_id从1—300。
lab的长度为0----299,这就导致在访问240—300时,访问到的序列刚好错开了一个样本的问题。
所以我把act_index改定为这样。
然而这样是访问不到300了,访问的是239—299,对应file_id为240----300的文件。
可是者衍生了一个新的问题,act_index不仅仅是读入lab的文件名,还是中间产物val_dataset的文件名,这个我又定的是240----300.
sad,这表明我不能用act_index同时去访问这两个,要有1的差别,最终我改为:
即act_index直接作为中间产物的索引,从240----300,而为了收集到正确对应的lab信息,我将act_index进行-1,刚好与默认索引相同。
重启运行整个项目,这一步顺利跑通了。
遇到新的问题是:
出现了除0问题,下次再看吧。