一、模型介绍
门牌号识别模型采用了基于 PyTorch 的深度卷积神经网络实现,旨在从街景图像中识别多位数的门牌号。利用来自 Google 街景门牌号的 SVHN 数据集,该模型经过训练,能够识别每张图像中的阿拉伯数字组合(0-9)并展现出令人瞩目的准确性,经测试可达到高达 89% 的精确度。用户提交包含门牌号的图像后,系统能够准确识别门牌号中的数字,为门牌号识别提供了一种实用而用户友好的解决方案。这一实现在基于图像的数字识别领域具有广泛的实际应用价值。
二、模型特点
高准确性 :进行测试,该模型在识别门牌号方面可达到高达 89% 的精确度,且在不同光照、角度等条件下均保持了较高的稳定性。
易用性 :用户只需上传包含门牌号的图像并提交,系统便能够有效地捕捉门牌号图像中的数字特征,从而实现对多位数门牌号的精准识别。
实用性 :这一实现在基于图像的数字识别领域为街景应用提供了可靠的技术支持,同时还可推广至其他数字识别场景,如交通标志识别、表格数据读取等,具有广泛的实际应用价值。
三、部署流程
1. 环境初始化
apt update #更新本地软件包索引。
apt upgrade #升级所有已安装的软件包到最新版本。
apt install build-essential #安装构建软件包所需的基本工具。
2. Python安装
apt install python3.10 #安装Python 3.10及其依赖
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple #pip设置全局的PyPI索引URL为清华镜像源,以加速Python包的下载。
3. miniconda安装
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh #网址输入 miniconda,找到相应版本的下载链接复制替换“ miniconda的下载连接”
bash Miniconda3-latest-Linux-x86_64.sh #观察上一步最后一行输出是否为这一内容,若不同的话将 Miniconda3_XXX 进行替换
4. 虚拟环境建立
conda create -n env_name python=3.10 #指定python环境及创建虚拟环境的名称。
conda activate env_name #激活虚拟环境。
nvcc -V #cuda版本查询,确定后期torch版本选择。
5. 模型资料下载(魔搭社区)
git lfs install
git clone https://www.modelscope.cn/studios/MuGeminorum/SVHN-Recognition.git
6. 查看依赖环境进行安装
pip install -r requirements.txt
依赖环境安装完成后,断线重连webssh窗口,重新激活虚拟环境,运行模型
export GRADIO_SERVER_NAME=0.0.0.0
export GRADIO_SERVER_PORT=8080
python3 app.py
回到容器端,开放访问端口,获取访问地址,到浏览器搜索,使用模型进行门牌号识别