高达82 fps的实时文本检测,可微分二值化模块
Real-time Scene Text Detection with Differentiable Binarization,出自华科白翔老师组,已中AAAI 2020 Oral,其在多个数据集上都取得了目前最好的精度,而且非常快,在输入图像size为512的设置下,可以实现高达82 fps的检测!
我自己在1070上的测试结果:
time 0.03690338134765625 torch.Size([1, 3, 480, 640])