现在加了校正的测试集 总共的样本有1w 多张。
训练和 val 的分配的比例是0.95 :0.05 (600-41)/600 =0.93
明天算一下详细的信息
把所有的训练集都跑了一遍,发现有219 张错误识别的
经过比对 有41 张是错误识别的 其他的是因为标注错误 但是识别正确的
所有的错误识别的样本如下:
A 模糊的样本
B 最后两位是半数的样本
C 反光的样本
D 错误检测的样本
上次错误识别的样本:8841 张训练样本的时候
比上次好了一些
现在的隐患问题是:
现在这个模型里面的数据 第一种水表的数据比较多 但是没有开头字母为7 和 9的样本 回头可能会出问题