![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CV
Yi_jia_yi
这个作者很懒,什么都没留下…
展开
-
街景字符编码识别_Task05模型集成
提高预测精度 1、集成学习方法可提高预测精度,常见集成学习方法有:Stacking、Bagging、Boosting等 2、数据集扩增(简称TTA)也可提高精度,对同一个样本预测三次再求平均 3、实验可知,长度为5的字符样本非常少,将定长设置为4可提高精度 ...原创 2020-06-02 23:31:31 · 178 阅读 · 0 评论 -
街景字符编码识别_Task04模型训练与验证
1 欠拟合和过拟合 欠拟合:即模型没有很好地捕捉到数据特征,不能够很好地拟合数据; 过拟合:即模型把数据学习的太彻底,导致测试的时候不能够很好地识别数据,即不能正确的分类,模型泛化能力太差。 过拟合原因:常见是模型复杂度太高 解决过拟合:构建一个与测试集尽可能分布相似的样本,训练过程不断验证模型在验证集上的精度,来控制模型的训练。因此可以划分验证集来进行验证, 2 评估方法 留出法:把数据集D划分为两个互斥的集合,其中一个是训练集,一个是测试集。书中给出的参考划分比例是,训练集66.6%~80% 交叉验证原创 2020-05-30 23:38:03 · 219 阅读 · 0 评论 -
街景字符编码识别_Task03字符识别模型
1 CNN原理 卷积神经网络CNN主要用于图像识别。 神经网络前向传播过程: 一般而言,输入的图像数据经过若干层卷积和池化处理,映射出特征向量/feature map,将特征向量传入全连接层中,得出分类识别的结果。当输出的结果与我们的期望值相符时,输出最后结果。 卷积:作用是提取特征图 池化:又称降采样/down_sampling,包括最大池化/max pooling、平均池化average pooling等,作用是降维 全连接:将学到的“分布式特征表示”映射到样本标记空间;对前层是全连接的全连接层可以转化原创 2020-05-26 23:29:57 · 163 阅读 · 0 评论 -
街景字符编码识别_Task02数据读取与扩增
1 Python中读取数据的库: Pillow:Pillow是图像处理函式库PIL的一个分支; 官方文档:https://pillow.readthedocs.io/en/stable/ OpenCV:包含很多图像处理功能以及图像特征处理算法,如关键点监测、边缘检测和直线检测 OpenCV官网:https://opencv.org/ 2 数据扩增方法 数据扩充一般从图像的颜色、尺寸、形态、空间和像素等角度进行变换 (torchvision为例) 3 数据扩增库 torchvision:扩充方法种类少、原创 2020-05-23 23:39:50 · 178 阅读 · 0 评论