computer vision笔记

最新推荐文章于 2024-09-15 13:45:34 发布

detmatrix

最新推荐文章于 2024-09-15 13:45:34 发布

阅读量210

点赞数

分类专栏： course 文章标签：计算机视觉

本文链接：https://blog.csdn.net/detmatrix/article/details/78764821

版权

course 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

导论

问题：什么是图片（image）？

二值图片：（0，1）
灰度图片：（0，255）
彩色图片：（0，255）× RGB３通道

计算机视觉的任务：
对图片进行理解。
图片：单幅、多幅、视频
理解：形状、位置、运动、类别

计算机视觉的路线图：
2D –> 3D –> 语义信息（直接2D–>语义信息？）
表示层次与三阶段

human vision：
错觉和 Gestalt理论（计算机视觉应该像人一样吗？）

第一课二值图像

特点：对内存要求小，同时能够保留足够的信息。
每个像素或者为0（称为背景），或者为1(称为前景）

算法1 把灰度图像转为二值图像 Otsu算法

几何特性：
1. 面积（零阶矩）、区域中心（一阶矩） y方向取负数
2. bounding box相关
方向：最小二乘法伸长率密集度
3. 欧拉数：连通分量数 - 洞数

投影计算：
提取图片的特征：竖直投影为直方图、水平投影为直方图、对角线投影（反映内部结构）

算法2 投影计算直方图

连通分量的定义和标记

算法3 连通分量标记

递归算法序贯算法

区域边界跟踪

算法4 区域边界跟踪

bonus：形态学算子

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

detmatrix

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

计算机视觉知识点总结

Bolt1st

04-26

1340

Rethinking the Inception Architecture for Computer Vision 论文笔记

Jayxbx的博客

04-16

691

0 摘要自从2014之后，深度卷积网络成为了计算机视觉解决方案的主流。模型的大小和计算成本的增加可以直接转换成质量收益。但是对于像移动视觉和大数据场景，计算效率和低参数计算仍是限制因素。本论文探索一种扩大网络的方法，目标是通过适当的分解卷积和积极的正则化来尽可能地有效利用增加的计算。 1 介绍从2014年开始，通过利用更深更宽的网络，网络架构的质量得到了明显改善。VGGNet和Goo...

参与评论您还未登录，请先登录后发表或查看评论

computer vision 机器视觉知识点整理

忽逢桃林的博客

01-01

2692

文章目录名词解释hyper-columninpaintingdetectordescriptor其他计算卷积 1colour opent cellsGestalt lawsglobal and local 名词解释 hyper-column a region of primary visual cortex (V1) that contains neurons covering the full ...

转载：计算机视觉任务(Computer Vision)整理

ChunleiYi的博客

09-15

1079

计算机视觉任务(Computer Vision)整理

七步带你认识计算机视觉

前路漫漫的博客

10-28

2708

如果想要机器能够进行思考，我们需要先教会它们去看。李飞飞——Director of Stanford AI Lab and Stanford Vision Lab 计算机视觉（Computer vision）是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图像处理，用计算机处理成更适合人眼观察或进行仪器检

数字图像处理笔记（一）——Connected-component labeling--连通区域标记

热门推荐

寻找如意的博客

07-06

1万+

转自：https://en.wikipedia.org/wiki/Connected-component_labelingConnected-component labeling (alternatively connected-component analysis, blob extraction, region labeling, blob discovery, or region extra...

computer Vision笔记

weixin_43991660的博客

02-24

121

阅读《Computer Vision》https://www.kaggle.com/learn/computer-vision 一、卷积网络一个卷积网络分类器可以看做由两部分组成：一部分是提取特征的base层，一部分基于特征做出分类决策的head层。 1、卷积网络如何实现特征提取？ base层执行特征提取包含三个基础操作卷积层：Filter图片过滤器，使用kernel映射图片卷积网络训练期间学习的权重主要包含在卷积层中，我们把这些权重称为Kernels。在卷基层的kernels决定它创造怎样的特征。选

Computer Vision笔记01：图像处理

MYJace的博客

06-13

1363

Computer Vision笔记01：图像处理Part 1什么是图像处理（Image Processing）图像处理（Image Processing）的分类空间域处理（Spatial Operation）基本的灰度变换（Intensity Transformation）灰度反转（Intersity Inversion）对数变换（Log Transformation）幂律（伽马）变换（Power Transformation）分段线性变换（Piecewise Linear Transformations）

墨尔本大学COMP-XXXX Computer vision 学习笔记总结

01-07

计算机视觉（Computer Vision，简称CV）是一门涉及数字图像或视频高级理解的算法技术。它致力于识别图像、定位和识别物体、分割图像区域、恢复三维结构、建立图像间的关系、执行视觉导航以及进行视觉引导的动作。...

intro-computervision:用于学习卷积神经网络各层的笔记本

05-16

计算机视觉概论该存储库包含一些笔记本，用于学习在给定一组训练数据的情况下如何使用卷积神经网络（CNN）创建图像分类器。这些笔记本包括用于学习构成卷积神经网络的各个图层的示例，以及在数据集上训练的示例...

《Computer vision》笔记-shufflenet（10）

01-20

《计算机视觉》笔记-ShuffleNet（10）卷积神经网络（CNN）在计算机视觉领域展现出了卓越的表现，但受限于嵌入式设备的内存和功耗限制，研究者们致力于开发更为高效的模型。GoogLeNet通过拓宽网络并降低复杂度，...

Deep Learning for Computer Vision 课程笔记

qq_34929889的博客

05-19

902

Deep Learning for Computer Vision 课程笔记–Lecture 1 计算机视觉(Computer Vision)和机器学习(Machine Learning)都属于人工智能(Artificial Intelligence)。深度学习(Deep Learning)是机器学习的一个子集，它与计算机视觉相交，并属于更大的AI领域。 CV和DL的背景 计算机视觉的历史是从60年代初开始的，Block World 是由Larry Roberts出版的一部作品，被广泛地称为计算机视觉的第一

介绍一下传统的图像处理算法？

GamBleout的博客

09-08

1011

包括低通滤波器（允许低频通过）、高通滤波器（允许高频通过）、带通滤波器（允许一定范围的频率通过）、带阻滤波器（允许一定范围的频率通过并阻止其他频率通过）、全通滤波器（允许所有频率通过，只改变相位）和陷波滤波器（阻止一个狭窄频率范围通过）。其中，Canny边缘检测是一种非常流行的算法，它通过多阶段处理（如图像降噪、计算梯度、非极大值抑制和双阈值筛选）来提取图像的边缘信息。直方图均衡化是一种用于改善图像对比度的技术，它通过重新分配图像的亮度值，使图像的直方图分布更加均匀，从而增强图像的视觉效果。

基于YOLOV8+Pyqt5光伏太阳能电池板目标检测系统

2301_78240361的博客

09-11

830

基于YOLOV8+Pyqt5光伏太阳能电池板目标检测系统

读论文-《基于计算机视觉的工业金属表面缺陷检测综述》

zxjiaya的博客

09-11

1145

读论文《基于计算机视觉的工业金属表面缺陷检测综述》,学习知识

目标检测-小目标检测方法

午夜的行人

09-06

997

每种方法和算法都有其优点和挑战，适当的选择和组合这些方法可以有效提升小目标的检测性能。根据具体的应用场景和计算资源需求，可以选择最适合的策略来优化模型的检测能力。

[数据集][目标检测]葡萄成熟度检测数据集VOC+YOLO格式1123张3类别

FL1623863129的博客

09-15

277

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)标注类别名称:["ripe grape","semiripe grape","unripe grape"]特别声明：本数据集不对训练的模型或者权重文件精度作任何保证，数据集只提供准确且合理标注。图片数量(jpg文件个数)：1123。标注数量(xml文件个数)：1123。标注数量(txt文件个数)：1123。标注规则：对类别进行画矩形框。

Python计算机视觉第9章-图像分割