图像视觉_卡小葵的博客-CSDN博客

图像视觉

关注

关注数：文章数：10 文章阅读量：21277 文章收藏量：51

作者: 卡小葵

写博客只是为了督促自己，慢慢整理，慢慢进步

展开

YOLO多张图片预测代码

##-------------------------------------## 对单张图片进行预测#-------------------------------------## from yolo import YOLO# from PIL import Image# yolo = YOLO()# while True:# img = input('Input image filename:')# try:# image = Imag

原创 2020-12-22 14:00:49 · 1155 阅读 · 1 评论
数据增强调研

文章目录数据增强调研报告一、常用的增强技术（一）几何变换（二）颜色空间转换二、一般增强技术（一）内核过滤器（Kernel filters）（二）混合图像(mixing image)[5]（三）、高级增强技术一、特征空间增强（Feature space augmentation）（二）、Adversarial training对抗训练（三）GAN‑based Data Augmentation[10][11]（四）、神经风格转移[11] Neural Style Transfe（五）、元学习[2][13]四、

原创 2020-11-23 11:13:21 · 1994 阅读 · 2 评论
CV之街景字符编码识别五----pytorch之模型集成

一、集成学习bagging:基本流程：Bagging的基本流程：经过 M 轮自助采样，可以得到 M 个包含 N 个训练样本的采样集。然后基于每个采样集训练出一个基学习器。最后将这 M 个基学习器进行组合，得到集成模型。在使用 Bagging学习器进行预测时：分类任务采取简单投票法，取每个基学习器的预测类别的众数。回归任务使用简单平均法，取每个基学习器的预测值的平均。参考链接：https://www.jianshu.com/p/4ef2ddf3d615Boosting 就是一族可以

原创 2020-06-02 19:09:34 · 368 阅读 · 0 评论
CV之街景字符编码识别三----pytorch之定义网络，损失函数和优化器

文章目录一、定义网络（Net）二、定义损失函数和优化器一、定义网络（Net）用一个名为Net的类定义需要继承torch.nn中的nn.Module(注意M大写）Net类包括初始化函数和forward函数两部分1）初始化init_(self): 放置有可学习参数的层（注意init前后均是两个下划线）a)对nn.Module初始化: super（Net, self）init()b)定义卷积和全连接操作（用到nn.Conv2d(), nn.Linear()）2)前向操作forward(self

原创 2020-05-25 10:54:42 · 221 阅读 · 0 评论
CV之街景字符编码识别----基于pytorch的数据读取与扩充

项目来源：https://tianchi.aliyun.com/competition/entrance/531795/informationtask参考：github链接本task主要是学习如何使用pytorch进行数据读取与扩充。常见的对图像数据的读取我们可以采用pillow和opencv库来进行。一、简单数据读取pillow读取与保存：im=Image.open("cat.jpg")im.save("cat.jpg",jpg)opencv读取：img=cv2.imread('cat

原创 2020-05-23 19:03:43 · 253 阅读 · 0 评论
CV之街景字符编码识别----赛题理解

项目来源：天池CVCV之街景字符编码识别----赛题理解赛题以街道字符为为赛题数据：如下所示：项目在提供字符标签的情况下考察模型的训练.其中给到的标签json文件中包含的内容有：最后以score作为评价指标即提交结果与实际图片的编码进行对比，以编码整体识别准确率为评价指标。任何一个字符错误都为错误，最终评测指标结果越大越好，具体计算公式如下：Score=编码识别正确的数量/测试集图片数量。整体而言就是对字符编码识别正确率的一个判断。但需要注意的问题，因赛题中提供的图片的字符长度不一，需

原创 2020-05-20 18:19:34 · 201 阅读 · 0 评论
mask RCNN将json 文件转换为Coco形式出现KeyError: 'imageData'

mask RCNN将json 文件转换为Coco形式：原代码：import argparseimport jsonimport matplotlib.pyplot as pltimport skimage.io as ioimport cv2from labelme import utilsimport numpy as npimport globimport PIL.Imag...

原创 2020-04-05 10:48:05 · 4747 阅读 · 6 评论
批处理图像文件大小Python代码 OSError: cannot write mode RGBA as JPEG ，解决方案

文章目录在批处理图像文件大小Python代码（图片格式都是JPG或者JPEG，以下代码可使用）：OSError: cannot write mode RGBA as JPEG批处理图像大小Python最终代码(适用于图像文件有png格式的）在批处理图像文件大小Python代码（图片格式都是JPG或者JPEG，以下代码可使用）：# -*- coding: utf-8 -*-import os...

原创 2020-04-03 21:43:16 · 3678 阅读 · 0 评论
YoLo卷积神经网络各层计算，卷积层计算输入的图片大小是448*448*3输出224*224*64原因？

该部分卷积层计算输入的t图片大小是4484483的，第一层卷积层，卷积核大小是77的，步长是2，pad=1，filters=64，请问输出为什么为：224224*64？回答：此处的pad应该类似于标志位，0或非0，不一定是1.即pad=1应该是指：pad为真看一下源码，在yolo里面pad=1的含义并不是pad=1，而是在处理的时候判断pad是否等于1，如果等于1，那pad=kernelsi...

原创 2020-03-07 18:11:32 · 6947 阅读 · 7 评论
交并比ion（ intersection over union ）及优化总结

1.IoUIoU又名交并比，是一种计算不同图像相互重叠比例的算法，时常被用于深度学习领域的目标检测或语义分割任务中。优点：IoU初步满足了计算两个图像的几何图形相似度的要求，简单实现了图像重叠度的计算。缺点：无法体现两个图形之间的距离以及图形长宽比的相似性。2.GIoUGIoU（Generalized Intersection over Union）相较于IoU多了一个‘Generali...

原创 2020-03-06 11:38:36 · 1713 阅读 · 0 评论

kaxiaokui的博客

图像视觉

作者: 卡小葵

YOLO多张图片预测代码

数据增强调研

CV之街景字符编码识别五----pytorch之模型集成

CV之街景字符编码识别三----pytorch之定义网络，损失函数和优化器

CV之街景字符编码识别----基于pytorch的数据读取与扩充

CV之街景字符编码识别----赛题理解

mask RCNN将json 文件转换为Coco形式出现KeyError: 'imageData'

批处理图像文件大小Python代码 OSError: cannot write mode RGBA as JPEG ，解决方案

YoLo卷积神经网络各层计算，卷积层计算输入的图片大小是4484483输出22422464原因？

交并比ion（ intersection over union ）及优化总结

图像视觉

作者: 卡小葵

YOLO多张图片预测代码

数据增强调研

CV之街景字符编码识别五----pytorch之模型集成

CV之街景字符编码识别三----pytorch之定义网络，损失函数和优化器

CV之街景字符编码识别----基于pytorch的数据读取与扩充

CV之街景字符编码识别----赛题理解

mask RCNN将json 文件转换为Coco形式 出现KeyError: 'imageData'

批处理图像文件大小Python代码 OSError: cannot write mode RGBA as JPEG ，解决方案

YoLo卷积神经网络各层计算，卷积层计算输入的图片大小是448*448*3输出224*224*64原因？

交并比ion（ intersection over union ）及优化总结

mask RCNN将json 文件转换为Coco形式出现KeyError: 'imageData'

YoLo卷积神经网络各层计算，卷积层计算输入的图片大小是4484483输出22422464原因？