先打卡,再返回来修改
赛题理解
看了官方的赛题理解,下载了SVHN公开数据集,了解了数据集的简介,并且了解了官方给的数据集:给定了相应的数字像素点的位置信息、训练集3W、验证集1W。同时此类相关检测有很多paper,所以可以找相关的算法进行了解。
难点
难点在于对不定长的字符进行识别,与传统的图像分类任务不太相同。
思路
给出了三个思路:
定长字符识别
因为所有图片中的字符总长度不大于6,所以将所有图片中的字符填充为6个,然后对每个字符分类中进行11个字符的分类。(其实不知道后边怎么分类,但是最后总结写之后的文档会讲解)
不定长字符识别
CRNN模型(待了解)
检测再识别
先检测出所要检测的物体的位置,然后再进行分类。可参考SSD和YOLO。