暑假实训验证码识别day 2
今天效率有点低下,主要是对tensorflow的一些了解
Tensorflow-gpu和cpu的对比,
Gpu版本对于计算量大的工作更加快速简便且成本低
Cpu则相对慢且成本高
所以选择gpu是更好的选择
再就是对于CNN(卷积神经网络)模型结构的了解
以及DNN(深度神经网络)
今天最重要的还是与健洲同学讨论一下该如何对于数据集分割的处理起初我认为能给我图片当然是最好,但考虑打标签工作量巨大,最后决定还是通过xml处理标签,至于是直接将xml里的内容交给模型训练,还是通过xml转成csv进行训练,我还是需要更加多地去查找资(如果能用xml直接来进行训练,那简直是方便太多了)对于这个问题,我也向研究生学长讨论了一下,结果是可以试试,毕竟xml就是标签那种,可能可以用python通过类似爬虫的方式得到这个图片的矩阵信息,然后再feed模型。
明日计划:
确定是用xml还是csv
选择合适的模型