引言:最近项目牵扯到识别检测,我个人是特别反感这个领域的,因为这个领域从预处理就十分复杂,再到之后的网络编写,以及相应的trick。诚然,工作量大代表创新的地方巨多,取舍全看个人。不过老板活都接了,那我只有入坑了。
Pnet训练技巧:我阅读完了tensorflow源代码,将其改为pytorch架构。我比较推崇pytorch,它代表着未来,虽然主流是tensorflow。
1.pytorch的图片输入格式是[batch,channel,row,col],用cv2或者PIL读入图片是[row,col,batch],因此你要从image.transpose进行转换,切记别使用reshape,因为它会直接改变图片像素分布,导致后面输出的图片很奇怪,切记!
2.cv2与PIL统一,如果你训练用cv2,那测试就用cv2。前面用PIL后面就用PIL。因为cv2读取图片是RGB顺序,而PIL是BGR,所以前后一致
Rnet:未完待续,请持续关注