计算机视觉
狗庄欺人太甚
目前方向为文本处理,之前有过两年的目标检测实习经历
展开
-
ICP配准
ICP配准找最近点找最优变换原创 2022-11-30 20:30:50 · 1275 阅读 · 0 评论 -
深度学习区分不同种类的图片
深度学习区分不同种类的图片原创 2022-07-27 21:02:43 · 1312 阅读 · 2 评论 -
fast slic 算法
fast slic算法,速度更快,性能更强的一种边缘检测算法原创 2022-03-08 20:44:51 · 2731 阅读 · 1 评论 -
恢复视频算法VRT
VSR通常需要利用多个相邻但通常不对齐的视频帧的时间信息。现有的方法通常利用滑动窗口策略或循环架构来解决这一问题,这要么受到逐帧恢复的限制,要么缺乏远程建模能力。 VRT的特点是并行计算和远程依赖建模,它在多个尺度上提取、对齐和融合帧特征 本文提出了相互注意以完成帧间相互对齐,这是隐式运动估计后的广义版本图像扭曲 VRT在视频恢复方面实现了最先进的性能,包括视频超分辨率、去模糊和去噪 https://github.com/JingyunLiang/VRT.githttps原创 2022-03-06 13:29:14 · 559 阅读 · 0 评论 -
slic去除识别效果图中的裂纹(修改opencv中的库函数)
识别出来的原图:识别后的效果图:slic_image = segmentation.mark_boundaries(image, m_slic,outline_color=(0,1,1))在这个函数里面修改,加上outline,同时膨胀boundaries将opencv中的boundaries.py改为如下代码:import numpy as npfrom scipy import ndimage as ndifrom .._shared.utils import _s原创 2022-03-05 21:40:04 · 2988 阅读 · 0 评论 -
opencv实现超像素分割(slic实现)
实现效果图:同时还使用了 mask图,要识别的区域为白色,背景为黑色import cv2import numpy as npimport os.path as ospimport osimport numpy as npfrom tqdm import tqdmfrom skimage import morphologyfrom skimage import segmentationdef get_ori_list(ori_folder): img_list = o原创 2022-03-05 21:33:49 · 3663 阅读 · 0 评论 -
floodfill算法
#在图像处理中就是给定一个种子点作为起始点,向附近相邻的像素点扩散,# 把颜色相同或者相近的所有点都找出来,并填充上新的颜色# 这些点形成一个连通的区域。 漫水填充算法可以用来标记或者分离图像的一部分#漫水填充算法实现最常见有四邻域像素填充法,# 八邻域像素填充法,基于扫描线的填充方法import cv2from matplotlib import imageimport numpy as npimport os.path as ospimport osimpo.原创 2022-03-02 16:30:31 · 1159 阅读 · 0 评论 -
watershed(分水岭算法)
为了检测出图中轮廓:算法效果比起slic差不少借鉴文章,这个讲的很不错OpenCv学习笔记5--图像分割之分水岭算法_wx612f24149b7fc的技术博客_51CTO博客https://blog.51cto.com/u_15351425/3725366import cv2import numpy as npimport osimport os.path as ospfrom tqdm import tqdmcheck_list = ['copper','bg','ch..原创 2022-03-01 21:48:14 · 1604 阅读 · 1 评论 -
如何将一张黑白图转为mask
mask是一个只包含True和False的ndarray,它的shape和data一致。这个数组是让你指定需要掩盖的值的,标记为True的数据会被掩盖掉。原创 2022-02-28 12:07:39 · 313 阅读 · 0 评论 -
利用前景和背景的mask图来得到边缘平滑的图像(graphcut实现)
github上的代码都是交互式的,我这个是通过mask来生成标签,无需交互graphcut原创 2022-02-22 21:49:15 · 2007 阅读 · 0 评论 -
‘maxflow‘ has no attribute ‘Graph‘
可能maxflow包维护的不行,安装另外一个包 pip3 install PyMaxflow原创 2022-02-21 16:10:10 · 1498 阅读 · 0 评论 -
利用autogluon对房价进行预测
AutoGluon 的兼容性和扩展性,可以很容易地将科研算法开展到大规模实验中。三大应用领域image(image classification、object detection) text(text classification) tabular data(tabular prediction)两大功能自动调参 支持PyTorch 支持的搜索策略包括random search、grid search、RL、Bayesian optimization等 NAS(仅支持image..原创 2022-02-15 21:22:20 · 1312 阅读 · 2 评论 -
制作类似于cityscapes数据集的流程,用来实现实时语义分割
制作类似于cityscapes数据集的流程,用来实现实时语义分割原创 2022-02-10 20:00:34 · 1370 阅读 · 3 评论 -
ERROR: Could not build wheels for cryptacular, which is required to install pyproject.
git clone https://github.com/NVIDIA/apexcd apexpip3 install -v --no-cache-dir ./原创 2022-01-24 22:24:47 · 6218 阅读 · 8 评论 -
读取xml文件中的信息
目的就是把标注为VOC格式数据(label中的txt)转化为标注为yolo格式数据:VOC格式标签:图片的实际宽和高,标注框的左上角和右下角坐标 YOLO格式标签:标注框的中心坐标(归一化的),标注框的宽和高(归一化的)...原创 2021-12-27 17:59:34 · 2185 阅读 · 0 评论 -
yolov5原理到实现
problem:QWidget::setLayout: Attempting to set QLayout "" on QTabWidget "tabWidget", which already has a layout原创 2021-12-20 17:54:49 · 5140 阅读 · 0 评论 -
cvat标注软件入门
GitHub链接:GitHub - openvinotoolkit/cvat: Powerful and efficient Computer Vision Annotation Tool (CVAT)安装方式:Installation Guide | CVATCVAT是用于计算机视觉的免费,在线,交互式视频和图像注释工具。可以用于模型训练数据的标注。CVAT在本地使用需要安装docker环境,在docker环境上启动。...原创 2021-12-06 17:41:39 · 1131 阅读 · 0 评论 -
如何利用语义分割扣除头发丝
参考论文:https://arxiv.org/pdf/2109.09406.pdfMatting精细化效果图1.基于辅助信息输入。除了原图和标注图像外,还需要输入其他的信息辅助预测。最常见的辅助信息是Trimap,即将图片划分为前景,背景及过度区域三部分。另外也有以背景或交互点作为辅助信息。2.不依赖任何辅助信息,直接实现Alpha预测。DIM-MattingDIM(Deep Image Matting)第一次阐述了在给定图像和辅助信息Trimap的情况下,可以通过.原创 2021-12-04 17:20:23 · 2908 阅读 · 0 评论 -
tensor简介
在深度学习里,Tensor实际上就是一个多维数组。而Tensor的目的是能够创造更高维度的矩阵、向量。彩色图像文件(RGB)一般都会处理成3-d tensor,每个3d array中的element表示一个像素,R代表Red,G代表Green,B代表Blue。image mode=P 一般都会处理为2-d tensor,每个2d array中的element表示一个像素接下来我们利用tensor做矩阵的运算import torchx = torch.tensor([2....原创 2021-11-13 16:58:50 · 4837 阅读 · 0 评论 -
利用语义分割(FCN)区分两种有文字和无文字区域
问题描述:图书馆中的书大小不一,为了保证美观,章的位置应该尽量贴到图书的第一页的空白区域原创 2021-10-30 12:47:29 · 684 阅读 · 0 评论 -
voc数据集格式详解
计算机视觉经常会用到voc数据集以如下数据集为例http://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/semantic_contours/benchmark.tgzAnnotations 包含着xml文件,就是利用roLabelImg进行标注JPEGImages 里面就是原始的图片train.txt和val.txt中列出的图像才进行使用SegmentationObject中对图中不同的物体进行的分割(生成.原创 2021-10-22 09:12:48 · 3511 阅读 · 0 评论