最近做自然场下的OCR识别,使用的是CRNN模型,因为需要训练数据,所以从github上找来了一个造数据的项目。
项目的地址为:https://github.com/Sanster/text_renderer
这个项目功能很强大,各种数据都很容易伪造,我记录下搭建它所需要的Docker环境。
FROM vastai/pytorch
COPY sources.list /etc/apt/
RUN mv /etc/apt/sources.list.d/cuda.list /tmp/ && mv /etc/apt/sources.list.d/nvidia-ml.list /tmp/
RUN apt-get update && apt-get install vim -y && pip install opencv-python -i https://pypi.doubanio.com/simple \
&& apt-get install cython -y \
&& apt-get install python3-tk -y\
&& pip install Pillow \
&& pip install fonttools -i https://pypi.doubanio.com/simple \
&& pip install tenacity -i https://pypi.doubanio.com/simple \
&& pip install easydict -i https://pypi.doubanio.com/simple \
&& pip install matplotlib -i https://pypi.doubanio.com/simple \
&& pip install fonttools -i https://pypi.doubanio.com/simple \
&& pip install -q --upgrade PyYAML==5.1 -i https://pypi.doubanio.com/simple --ignore-installed \
&& apt-get install libglib2.0-dev -y \
&& apt-get install -y python-qt4 \
&& apt-get install python-numpy -y \
&& pip install pyyaml -i https://pypi.doubanio.com/simple
# Set timezone
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
COPY ./text_renderer-master /src/notebooks/
WORKDIR /src/notebooks/
# Set locale
ENV LANG C.UTF-8
PS,基础镜像可以随便从DockerHub上拉一个有python3环境的就可以了。