![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图像视觉
卡小葵
写博客只是为了督促自己,慢慢整理,慢慢进步
展开
-
YOLO多张图片预测代码
##-------------------------------------## 对单张图片进行预测#-------------------------------------## from yolo import YOLO# from PIL import Image# yolo = YOLO()# while True:# img = input('Input image filename:')# try:# image = Imag原创 2020-12-22 14:00:49 · 1155 阅读 · 1 评论 -
数据增强调研
文章目录数据增强调研报告一、常用的增强技术(一)几何变换(二)颜色空间转换二、一般增强技术(一)内核过滤器(Kernel filters)(二)混合图像(mixing image)[5](三)、高级增强技术一、特征空间增强(Feature space augmentation)(二)、Adversarial training对抗训练(三)GAN‑based Data Augmentation[10][11](四)、神经风格转移[11] Neural Style Transfe(五)、元学习[2][13]四、原创 2020-11-23 11:13:21 · 1994 阅读 · 2 评论 -
CV之街景字符编码识别五----pytorch之模型集成
一、集成学习bagging:基本流程:Bagging的基本流程:经过 M 轮自助采样,可以得到 M 个包含 N 个训练样本的采样集。然后基于每个采样集训练出一个基学习器。最后将这 M 个基学习器进行组合,得到集成模型。在使用 Bagging学习器进行预测时:分类任务采取简单投票法,取每个基学习器的预测类别的众数。回归任务使用简单平均法,取每个基学习器的预测值的平均。参考链接:https://www.jianshu.com/p/4ef2ddf3d615Boosting 就是一族可以原创 2020-06-02 19:09:34 · 368 阅读 · 0 评论 -
CV之街景字符编码识别三----pytorch之定义网络,损失函数和优化器
文章目录一、定义网络(Net)二、定义损失函数和优化器一、定义网络(Net)用一个名为Net的类定义需要继承torch.nn中的nn.Module(注意M大写)Net类包括初始化函数和forward函数两部分1)初始化init_(self): 放置有可学习参数的层(注意init前后均是两个下划线)a)对nn.Module初始化: super(Net, self)init()b)定义卷积和全连接操作(用到nn.Conv2d(), nn.Linear())2)前向操作forward(self原创 2020-05-25 10:54:42 · 221 阅读 · 0 评论 -
CV之街景字符编码识别----基于pytorch的数据读取与扩充
项目来源:https://tianchi.aliyun.com/competition/entrance/531795/informationtask参考:github链接本task主要是学习如何使用pytorch进行数据读取与扩充。常见的对图像数据的读取我们可以采用pillow和opencv库来进行。一、简单数据读取pillow读取与保存:im=Image.open("cat.jpg")im.save("cat.jpg",jpg)opencv读取:img=cv2.imread('cat原创 2020-05-23 19:03:43 · 253 阅读 · 0 评论 -
CV之街景字符编码识别----赛题理解
项目来源:天池CVCV之街景字符编码识别----赛题理解赛题以街道字符为为赛题数据:如下所示:项目在提供字符标签的情况下考察模型的训练.其中给到的标签json文件中包含的内容有:最后以score作为评价指标即提交结果与实际图片的编码进行对比,以编码整体识别准确率为评价指标。任何一个字符错误都为错误,最终评测指标结果越大越好,具体计算公式如下:Score=编码识别正确的数量/测试集图片数量。整体而言就是对字符编码识别正确率的一个判断。但需要注意的问题,因赛题中提供的图片的字符长度不一,需原创 2020-05-20 18:19:34 · 201 阅读 · 0 评论 -
mask RCNN将json 文件转换为Coco形式 出现KeyError: 'imageData'
mask RCNN将json 文件转换为Coco形式:原代码:import argparseimport jsonimport matplotlib.pyplot as pltimport skimage.io as ioimport cv2from labelme import utilsimport numpy as npimport globimport PIL.Imag...原创 2020-04-05 10:48:05 · 4747 阅读 · 6 评论 -
批处理图像文件大小Python代码 OSError: cannot write mode RGBA as JPEG ,解决方案
文章目录在批处理图像文件大小Python代码(图片格式都是JPG或者JPEG,以下代码可使用):OSError: cannot write mode RGBA as JPEG批处理图像大小Python最终代码(适用于图像文件有png格式的)在批处理图像文件大小Python代码(图片格式都是JPG或者JPEG,以下代码可使用):# -*- coding: utf-8 -*-import os...原创 2020-04-03 21:43:16 · 3678 阅读 · 0 评论 -
YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?
该部分卷积层计算输入的t图片大小是4484483的,第一层卷积层,卷积核大小是77的,步长是2,pad=1,filters=64,请问输出为什么为:224224*64?回答:此处的pad应该类似于标志位,0或非0,不一定是1.即pad=1应该是指:pad为真看一下源码,在yolo里面pad=1的含义并不是pad=1,而是在处理的时候判断pad是否等于1,如果等于1,那pad=kernelsi...原创 2020-03-07 18:11:32 · 6947 阅读 · 7 评论 -
交并比ion( intersection over union )及优化总结
1.IoUIoU又名交并比,是一种计算不同图像相互重叠比例的算法,时常被用于深度学习领域的目标检测或语义分割任务中。优点:IoU初步满足了计算两个图像的几何图形相似度的要求,简单实现了图像重叠度的计算。缺点:无法体现两个图形之间的距离以及图形长宽比的相似性。2.GIoUGIoU(Generalized Intersection over Union)相较于IoU多了一个‘Generali...原创 2020-03-06 11:38:36 · 1713 阅读 · 0 评论