MTCNN心得体会

引言:最近项目牵扯到识别检测,我个人是特别反感这个领域的,因为这个领域从预处理就十分复杂,再到之后的网络编写,以及相应的trick。诚然,工作量大代表创新的地方巨多,取舍全看个人。不过老板活都接了,那我只有入坑了。

Pnet训练技巧:我阅读完了tensorflow源代码,将其改为pytorch架构。我比较推崇pytorch,它代表着未来,虽然主流是tensorflow。

1.pytorch的图片输入格式是[batch,channel,row,col],用cv2或者PIL读入图片是[row,col,batch],因此你要从image.transpose进行转换,切记别使用reshape,因为它会直接改变图片像素分布,导致后面输出的图片很奇怪,切记!
2.cv2与PIL统一,如果你训练用cv2,那测试就用cv2。前面用PIL后面就用PIL。因为cv2读取图片是RGB顺序,而PIL是BGR,所以前后一致

Rnet:未完待续,请持续关注

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值