readme
亏了一波都不知道这个比赛 http://transcriptorium.eu/~htrcontest/MathsICDAR2021/
每年12月开始
7244 train vs 4028 test,两类,一类是isolated 一类是embeded
2107.05534
数据集难点:
- size 变化大
- ratio变化大
- 不少字符特别小
- 无用背景不少
应对方案
-
针对size变化大,用ATSS
-
针对部分字符特别小,把FPN默认的3-7改为2-6 | 这会慢不少
-
针对无用背景少,采用random crop到800,800
-
作者感觉极小目标的embeded,采用合适的FPN层和ATSS有明显涨点
-
ResNeSt涨点明显
-
改用更大的crop size 涨了1.5个点
-
Ranger明显优于Adam,好0.5,但是我感觉SGD可能更好
-
里面的RegMax 有点意思,修改了GFL的参数,It represents the largest position regression offset in each layer of FPN. In order to deal with the slim isolated formula, 从16-24 + 0.08
-
GFL
-
ATSS
-
ResNeSt
-
SyncBN
-
WBF
-
Ranger
2104.03544
没大意思,就是个yolov5s 做了个类别均衡,然后半监督,写的也很单薄
2105.01846
ICDAR 2021 Competition on Scientific Table Image Recognition to LaTeX.
没大兴趣,是个nlp的任务,这里面ranger好于adam情有可原