Datawhale 零基础入门CV赛事街景字符识别学习笔记--第1次打卡

meili1021

于 2020-05-20 22:44:32 发布

阅读量157

收藏

点赞数

分类专栏： python3 文章标签： cv 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/meili1021/article/details/106246230

版权

python3 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

安装python3.7版本、pytorch、jupyter、tqdm、opencv-python、matplotlib、pandas，在windows环境下安装的，没有GPU，安装的过程和教程中给的有点点差异，好在顺利安装完成。直接按照教程中命令执行，报错，找不到相应的包，命令修改为

conda install pytorch=1.3.1 torchvision cudatoolkit=10.0 –c pytorch

-c是从官方源下载，配置了国内源的话，不加-c更快；

或者配置国内的源，不加-c，用下面的命令：conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64

安装成功了，但是导入的时候还是报错，使用下面的命令安装：

pip3 install https://download.pytorch.org/whl/cpu/torch-1.1.0-cp37-cp37m-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/

安装0.2.1版本的torchvision，解决，import成功

2. Baseline流程梳理：

1）定义读取图像的Dataset；

2）定义训练数据和验证数据的Dataset；

3）定义字符分类模型，使用ResNet18的模型进行特征提取；

4）定义训练、验证和预测模块；

5）迭代训练和验证模型；

6）对测试集样本进行预测，生成提交文件

3. 实现过程

1）训练模型时报错

解决方法：该问题的产生是由于windows下多线程的问题，和DataLoader类有关，具体细节点这里Fix memory leak when using multiple workers on Windows。

解决方案：修改调用torch.utils.data.DataLoader()函数时的num_workers参数。该参数官方API解释如下：

num_workers (int, optional) – how many subprocesses to use for data loading. 0
means that the data will be loaded in the main process. (default: 0)

该参数是指在进行数据集加载时，启用的线程数目。截止当前2018年5月9日11:15:52，如官方未解决该BUG，则可以通过修改num_works参数为 0 ，只启用一个主进程加载数据集，避免在windows使用多线程即可。

2）训练模型时报错

解决方法：target=target.long()

meili1021

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Datawhale 零基础入门CV赛事街景字符识别学习笔记--第1次打卡

安装python3.7版本、pytorch、jupyter、tqdm、opencv-python、matplotlib、pandas，在windows环境下安装的，没有GPU，安装的过程和教程中给的有点点差异，好在顺利安装完成 Baseline流程梳理： 1）定义读取图像的Dataset； 2）定义训练数据和验证数据的Dataset； 3）定义字符分类模型，使用ResNet18的模型进行特征提取； 4）定义训练、验证和预测模块；...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值