python tools/train.py --config_file “config/icdar2015_resnet18_FPN_DBhead_polyLR.yaml”
如果缺少包就会包错误,如果看不到错误,说明都安装了。
==============================================================
数据集使用icdar2015,网页链接:Downloads - Incidental Scene Text - Robust Reading Competition (uab.es),需要注册。
选择Task4.1:Text Localization
数据的详细介绍:Tasks - Incidental Scene Text - Robust Reading Competition (uab.es)
任务 4.1:文本本地化 对于文本本地化任务,我们将为每个图像提供单词边界框。 基本事实作为单独的文本文件(每个图像一个)给出,其中每一行指定一个单词边界框的坐标及其以逗号分隔格式的转录(参见图 1)。
对于文本本地化任务,地面实况数据以单词边界框的形式提供。 与挑战 1 和 2 不同,边界框在挑战 4 中不是轴定向的,它们由四个角的坐标以顺时针方式指定。 对于训练集中的每个图像,将按照命名约定提供一个单独的 UTF-8 文本文件:
gt_[image name].txt
文本文件是逗号分隔的文件,其中每一行将对应于图像中的一个单词,并给出其边界框坐标(四个角,顺时针)及其格式的转录:
x1, y1, x2, y2, x3, y3, x4, y4, transcription
请注意,第八个逗号后