长颈鹿与麋鹿-CSDN博客

原创 PCL学习笔记-PCL简介

PCL（点云库）学习笔记1.简介点云数据的处理可以采用获得广泛应用的Point Cloud Library（点云库，PCL库）。PCL库是一个最初发布于 2013年的开源c++库，它实现了大量点云相关的通用算法和高效的数据管理。支持多种操作系统平台，可在Windows、Linux、Android、Mac OS X、部分嵌入式实时系统上运行。如果说OpenCV是2D信息获取与处理的技术结晶，那么PCL在3D信息获取与处理上，就与OpenCV具有同等地位，PCL是BSD授权方式，可以免费进行商业和学术应

2020-12-12 14:23:32 2348

原创 OpenCV视频学习笔记（16）-背景建模

十六、背景建模怎样捕捉一个物体是前景（运动）还是背景（静止）？有两个方法方法一：帧差法由于场景中的目标在运动，目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧图像进行差分运算，不同帧对应的像素点相减，判断灰度差的绝对值，当绝对值超过一定阈值时，即可判断为运动目标，从而实现目标的检测功能。帧差法非常简单，但会引入噪音和空洞问题。方法二：混合高斯模型在进行前景检测前，先对背景进行训练，对图像中每个背景采用一个混合高斯模型进行模拟，每个背景的混合高斯的个数可以自适应。然后在测试阶段，对新

2020-12-12 14:22:58 485

原创 OpenCV视频学习笔记（20）-卷积原理与操作

二十、卷积原理与操作神经网络（1）准备数据；（2）前向传播，算出输出（分类结果/回归结果），得到损失函数（衡量对当前数据拟合的好坏）；（3）反向传播计算梯度值，看权重值分别对loss产生多大影响，看怎么改权重值，可以使得loss值越低越好；（4）更新参数，反复计算，得到较好的权重值；卷积神经网络可以做什么：Classification分类任务；Retrieval同类推荐；Detection物体检测（分类和回归）；Segmentation图像元素分割；Detection可应用于：se

2020-12-12 14:22:34 255

原创 OpenCV视频学习笔记（19）-项目实战-目标追踪

十九、项目实战-目标追踪步骤：导入代码；配置图片/视频参数，以及要使用的OpenCV中的算法（kcf算法）；可执行单任务单目标/多任务多目标的追踪；Multi_object_tracking.pyimport argparseimport timeimport cv2import numpy as np// 配置参数ap = argparse.ArgumentParser()ap.add_argument("-v", “–video”, type=str,help=“path to

2020-12-12 14:22:14 616

原创 OpenCV视频学习笔记（5）-图像梯度处理

五、图像梯度处理图像梯度-Sobel算子Gx右边减左边，Gy下边减上边首先读取图像：img=cv2.imread(‘D:/graduate/pie.png’)cv2.imshow(‘img’,img)cv2.waitKey()#cv2.destoryAllWindows()将图像读取写成函数：def cv_show(img,name):cv2.imshow(name,img)cv2.waitKey()cv2.destroyAllWindows()dst=cv2.Sobel(src,

2020-12-12 14:21:50 181

原创 OpenCV视频学习笔记（8）-直方图与傅里叶变换

八、直方图与傅里叶变换直方图：cv2.calcHist(images,channels,mask,histSize,ranges)¶images: 原图像图像格式为 uint8 或 ﬂoat32。当传入函数时应用中括号 [] 括来例如[img]channels: 同样用中括号括来它会告函数我们统幅图像的直方图。如果入图像是灰度图它的值就是 [0]如果是彩色图像的传入的参数可以是 [0][1][2] 它们分别对应着 BGR。mask: 掩模图像。统整幅图像的直方图就把它为 None。但是如

2020-12-12 14:21:24 188

原创 OpenCV视频学习笔记（15）-项目实战-答题卡识别判卷

十五、项目实战-答题卡识别判卷步骤：（1）对图像进行滤波操作；（2）边缘检测；（3）透视变换；（4）看一下选择的是哪个答案，进行二值处理；（5）判断选择的答案，通过计算圆圈里面非0点的个数，也就是黑白比例来看；#导入工具包import numpy as npimport argparseimport imutilsimport cv2//设置参数ap = argparse.ArgumentParser()ap.add_argument("-i", “–image”, requir

2020-12-12 14:20:55 427

原创 OpenCV视频学习笔记（14）-项目实战-停车场车位识别

十四、项目实战-停车场车位识别输入数据是视频；步骤：（1）统计多少停车位被占据了；（2）统计还有多少停车位空闲着；（3）哪个停车位被占了，哪个没被占标识出来；实现步骤：（1）边缘检测，检测每一个车位的位置（坐标点），同时还要过滤掉干扰项；（2）把每个位置裁剪出来，做建模操作，判别位置有没有被占据，也就是进行分类任务；Parking.pyimport matplotlib.pyplot as pltimport cv2import os, globimport numpy as np

2020-12-12 14:20:23 1024

原创 OpenCV视频学习笔记（13）-案例实战-全景图像拼接

十三、案例实战-全景图像拼接特征匹配Brute-Froce蛮力匹配对比两张图象中哪些关键点比较类似，距离比较近，即比较向量之间的差异。首先导入工具包，读取图像；import cv2import numpy as npimport matplotlib.pyplot as plt%matplotlib inlineimg1 = cv2.imread(‘D:/graduate/test picture/box.png’, 0)img2 = cv2.imread(‘D:/graduate/te

2020-12-12 14:20:03 463

原创 OpenCV视频学习笔记（12）-图像特征-sift算法

十二、图像特征-sift算法Scale Invariant Feature Transform(SIFT)图像尺度空间（为了使得到的特征点更准确）在一定的范围内，无论物体是大还是小，人眼都可以分辨出来，然而计算机要有相同的能力却很难，所以要让机器能够对物体在不同尺度下有一个统一的认知，就需要考虑图像在不同的尺度下都存在的特点。不同标准差（a）的高斯函数决定了对图像的平滑程度，越大的a值对应的图像越模糊。五层金字塔，金字塔的每层都要做高斯滤波。高斯差分金字塔（DOG），通过减法求差分，找差分值较大

2020-12-12 14:19:08 220

原创 OpenCV视频学习笔记（11）-图像特征-harris

十一、图像特征-harris图像特征-harris角点检测：角点：无论是沿着水平还是竖直移动，图像变化都非常明显；基本原理：cv2.cornerHarris()img：数据类型为 ﬂoat32 的入图像blockSize：角点检测中指定区域的大小ksize： Sobel求导中使用的窗口大小（求Ix，Iy）k：取值参数为 [0,04–0.06]之间import cv2import numpy as npimg = cv2.imread(‘D:/graduate/test

2020-12-12 14:18:44 143

原创 OpenCV视频学习笔记（10）-项目实战-文档扫描OCR识别

十、项目实战-文档扫描OCR识别实践步骤：首先将包含代码的文件夹复制到opencv工程中；打开sacn.py;配置图片参数：RUN–>Edit Configurations–>scan–>Parameters输入–image ./images/receipt.jpg–>apply代码处理步骤：（1）读取图片（图片拍摄角度任意）；（2）边缘检测；（3）轮廓检测；（4）一系列图片变换操作（平移、旋转、翻转），把图片位置调正；（5）字符识别，中文、英文、数字；因为作者

2020-12-12 11:59:02 473

原创 OpenCV视频学习笔记（9）-项目实战-信用卡数字识别

九、项目实战-信用卡数字识别（融合前面的图像操作）轮廓检测+轮廓外接矩形+模板匹配+resize成一样的大小预处理：对轮廓做过滤操作，保存下数字的轮廓，根据长宽比例过滤先在eclipse中配置Python环境，注意版本匹配这里下载的eclipse是eclipse-java-2019-03在Eclipse中添加Python的环境Eclipse -> Help -> Install New SoftWare -> Add ，在弹出的框添加python仓库地址http://pydev.

2020-12-12 11:58:21 336 1

原创 OpenCV视频学习笔记（7）-图像金字塔与轮廓检测

七、图像金字塔与轮廓检测图像金字塔应用：可以对金字塔中的每一次都进行特征提取，再进行总结(1)高斯金字塔(2)拉普拉斯金字塔import cv2 #opencv读取的格式是BGRimport numpy as npimport matplotlib.pyplot as plt#Matplotlib是RGB%matplotlib inlinedef cv_show(img,name):cv2.imshow(name,img)cv2.waitKey()cv2.destroyAllWind

2020-12-12 11:58:03 183

原创 OpenCV视频学习笔记（6）-边缘检测算法

六、边缘检测算法（综合了前面几节课的内容）Canny边缘检测1）使用高斯滤波器，以平滑图像，滤除噪声2）计算图像中每个像素点的梯度强度和方向3）应用非极大值（Non-Maximum Suppression）抑制，以消除边缘检测带来的杂散响应4）应用双阈值（Double-Threshold）检测来确定真实和潜在的边缘5）通过抑制孤立的弱边缘最终完成边缘检测（1）高斯滤波（2）梯度和方向（3）非极大值抑制（两种方法）：比较当前这个点和周围两个点的大小，如果是最大的就保存，如果不是就抑制掉（4

2020-12-12 11:57:45 209

原创 OpenCV视频学习笔记（1）-准备工作

一、准备工作1.安装Anaconda2.Anaconda Prompt安装opencv（1）如果系统当中只有一个Python环境，直接输入pip install；（2）如果有多个Python环境，去指定的位置安装；进入到Anaconda安装的路径，输入：cd anaconda3输入dir查看目录，输入python，查看python环境：(base) C:\Users\16550.000\anaconda3>pythonPython 3.7.6 (default, Jan 8 2020

2020-12-12 11:55:13 627

原创 OpenCV视频学习笔记（3）-图像阈值与平滑处理

三、图像阈值与平滑处理图像阈值处理ret,dst=cv2.threshold(src,thresh（127）,maxval（255）,type)src：输入图只能输入单通道图像，通常来说为灰度图dst：输出图thresh：阈值maxval：当像素值超过了阈值（或者小于阈值，根据type来决定），所赋予的值type：二值化操作的类型，包括以下5种类型：cv2.THRESH_BINARY；cv2.THRESH_BIANRY_INV；cv2.THRESH_TRUNC；cv2.THRESH_TOZE

2020-12-12 11:54:24 209

原创 OpenCV视频学习笔记（2）-图像基本操作

二、图像基本操作图像在计算机眼中，是由许多个像素点组成。Opencv中图像的基本操作：1.数据读取-图像cv2.IMREAD_COLOR：彩色图像Cv2.IMREAD_GRAYSCALE：灰度图像读取彩色图像代码：import cv2 #opencv读取的格式是BGR，不是RGBimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlineimg=cv2.imread(‘D:/graduate/cat.jpg’)

2020-12-12 11:54:02 160

原创第十一章自动编码器

简介：自动编码器是一种可以进行无监督学习的神经网络模型。一般而言，一个完整的自动编码器主要由两部分组成，分别是用于核心特征提取的编码部分和可以实现数据重构的解码部分。1.自动编码器入门在自动编码器中负责编码的部分也叫做编码器（Encoder），而负责解码的部分也叫作解码器（Decoder）。编码器主要负责对原始的输入数据进行压缩并提取数据中的核心特征，而解码器主要是对在编码器中提取的核心特征进行展开并重新构造出之前的输入数据。如图就是一个简化的自动编码器模型，它的主要结构是神经网络，该模型的最左边是用

2020-12-12 11:52:44 357

原创第十章循环神经网络

简介：循环神经网络（RNN）主要被用于处理序列相关的问题，比如在自然语言领域应用循环神经网络的情况就较多；循环神经网络也可以用于解决分类问题，虽然在图片特征的提取上没有卷积神经网络那样强大，但是本章仍然会使用循环神经网络来解决图片分类的问题，并主要讲解循环神经网络的工作机制和原理。1.循环神经网络入门之前讲到，卷积神经网络有几个特点：首先，对于一个已经搭建好的卷积神经网络模型，它的输入数据的维度是固定的，比如在处理图片分类问题时输入的图片大小是固定的；其次卷积神经网络模型最后输出的数据的维度也是固定的，

2020-12-12 11:52:31 298

原创第九章多模型融合

简介：通过一些科学的方法对优秀的模型进行融合，以突破单个模型对未知问题的泛化能力的瓶颈，并且综合各个模型的优点得到同一个问题的最优解决方法，这就是多模型融合。多模型融合的宗旨就是通过科学的方法融合各个模型的优势，以获得对未知问题的更强的解决能力。1.多模型融合入门使用多模型融合方法融合神经网络模型的过程中会遇到的问题：首先，在使用融合神经网络模型的过程中遇到的第1个问题就是训练复杂神经网络非常耗时，因为优秀的模型一般都是深度神经网络模型，这些网络模型的特点是层次较深、参数较多，所以对融合了多个深度神经

2020-12-12 11:52:13 2491 1

原创第八章图像风格迁移实战

简介：本章基于卷积神经网络实现图像风格迁移（Style Transfer）。和之前基于卷积神经网络的图像分类有所不同，这次是神经网络与艺术的碰撞。1.风格迁移入门图像风格迁移算法的实现逻辑并不复杂：首先选取一幅图像作为基准图像，也可以将其叫作内容图像，然后选取另一幅或多幅图像作为我们希望获取相应风格的图像，也可以叫作风格图像。图像风格迁移的算法就是在保证内容图像的内容完整性的前提下，将风格图像的风格融入内容图像中，使得内容图像的原始风格最后发生了转变，最终的输出图像呈现的将是输入的内容图像的内容和风格

2020-12-12 11:51:58 512

原创第七章迁移学习

简介：本章将通过搭建卷积神经网络模型对生活中的普通图片进行分类，并引入迁移学习（Transfer Learning）方法。为了验证迁移学习方法的方便性和高效性，我们先使用自定义结构的卷积神经网络模型解决图片的分类问题，然后通过使用迁移学习方法得到的模型来解决同样的问题，以此来看看在效果上是传统的方法更出色，还是迁移学习方法更出色。（因为本章代码使用CPU运行时间高达5个小时，所以暂时没有进行实践。）1.迁移学习入门使用迁移模型解决同一类问题，由于这种方法的出现，我们通过对一个训练好的模型进行细微调整，

2020-12-12 11:51:47 421

原创第六章 PyTorch基础

简介： PyTorch是美国互联网巨头Facebook在深度学习框架Torch的基础上使用Python重写的一个全新的深度学习框架，它更像NumPy的替代物，不仅继承了NumPy的众多优点，还支持GPUs计算，在计算效率上要比NumPy有更明显的优势；不仅如此，，PyTorch还有许多高级功能，比如拥有丰富的API，可以快速完成深度神经网络模型的搭建和训练。...

2020-12-12 11:51:14 1358

原创第五章 Python基础

1.Python简介Python特性：（1）易读性：Python的语法结构层次分明，语法逻辑简单易懂。（2）解释性：在Python中去除了编译环节和链接环节，这些修改提升了语言的解释性，提升了程序的开发效率，所以Python进行程序开发能够相对缩短开发周期。（3）可移植性：因为Python在设计之初就是一门面向开源的编程语言，而开源的一大特性就是兼容性，所以Python能够被众多平台移植和使用。（4）可扩展性：Python能够使用其他程序语言实现自身的扩展。（5）交互性：Python提供了很多实

2020-12-12 11:50:57 762

原创第四章卷积神经网络

**卷积神经网络（CNN）是深度神经网络模型中的“明星”网络架构。一个标准的卷积神经网络架构主要由卷积层、池化层和全连接层等核心层次构成。1.卷积神经网络基础1）卷积层卷积层（Convolution Layer）的主要作用是对输入的数据进行特征提取，而完成该功能的是卷积层中的卷积核（Filter）。我们可以将卷积核看作一个指定窗口大小的扫描器，扫描器通过一次又一次的扫描输入的数据，来提取数据中的特征。如果我们输入的是图像数据，那么在通过卷积核的处理后，就可以识别出图像中的重要特征了。卷积通用公式，用

2020-12-12 11:50:36 207

原创第三章深度神经网络基础

1.监督学习和无监督学习监督学习和无监督学习是在机器学习中经常被提及的两个重要的学习方法。（1）监督学习（缺点：需要投入大量的精力处理原始数据）（优点：得到的模型更符合设计者的需求和初衷）监督学习：提供一组输入数据和其对应的标签数据，然后搭建一个模型，让模型在通过训练后准确地找到输入数据和标签数据之间的最优映射关系，在输入新的数据后，模型能够通过之前学到的最优映射关系，快速的预测出这组新数据的标签。回归问题：回归问题就是使用监督学习的方法，让我们搭建的模型在通过训练后建立起一个连续的线性映射关

2020-12-12 11:50:03 916

原创第二章相关的数学知识

1.矩阵运算入门矩阵的优势是能够进行大规模的并行运算，所以将军阵的计算方式引入计算机中能够很大程度的提升计算机的计算效率。（1）标量、向量、矩阵和张量标量：·

2020-12-12 11:49:48 86

原创第一章浅谈人工智能、神经网络和计算机视觉

概要：本章将对人工智能及其相关的知识进行简单介绍，对人工智能及其相关知识进行初步了解。1.1 人工还是智能人工智能可以细分为强人工智能和弱人工智能，弱人工智能更注重“人工”的重要性，强人工智能更注重“智能”的重要性。1.2 人工智能的三起两落机器学习、深度学习等技术成为人工智能的主流，再加上大数据和计算机硬件的快速发展，使人工智能再次卷土重来。机器学习和深度学习技术具备一个共同的特点：它们都需要使用尽可能多的数据来完成对自身模型的训练，这样才能让最终输出的模型拥有强大的泛化能力。当前在计算机视觉

2020-12-12 11:49:30 677

原创深度学习入门学习--第八章深度学习

第八章深度学习深度学习是加深了层的深度神经网络。基于之前介绍的网络，只需通过叠加层，就可以创建深度网络。1.加深网络（1）向更深的网络出发创建一个比之前实现的网络的更深的CNN。这里使用的卷积层全都是3✖3的小型滤波器，特点是随着层的加深，通道数变大（卷积层的通道数从前面的层开始按顺序以16、16、32、32、64、64的方式增加）。此外，插入了池化层，以逐渐减小中间数据的空间大小；并且，后面的全连接层中使用了Dropout层。这个网络使用He初始值作为权重的初始值，使用Adam更新权重参数。总

2020-12-12 11:46:51 457

原创深度学习入门学习--第七章卷积神经网络

第七章卷积神经网络卷积神经网络（CNN）。CNN被用于图像识别、语音识别等各种场合，在图像识别的比赛中，基于深度学习的方法几乎都以CNN为基础。1.整体结构了解CNN的网络结构和大致框架。CNN和之前介绍的神经网络一样，可以像乐高积木一样通过组装层来构建。不过，CNN中新出现了卷积层（Convolution层）和池化层（Pooling层）。之前介绍的神经网络中，相邻层的所有神经元之间都有连接，这称为全连接。另外，我们使用了Affine层实现了全连接层。CNN中新增了Convolution层和Poo

2020-12-12 11:46:16 885

原创深度学习入门学习--第六章与学习相关的技巧

介绍神经网络的学习中的一些重要观点，主题涉及寻找最优权重参数的最优化方法，权重参数的初始值，超参数的设定方法等。为了应对过拟合，还介绍权值衰减，Dropout等正则方法，最后还有Batch Normalization方法。1.参数的更新神经网络的学习的目的是找到损失函数嗯值尽可能小的参数。这是寻找最优参数的问题，解决这个问题的过程称为最优化。介绍四种更新参数的方法:SGD、Momentum、AdaGrad、Adam等。这四种方法各有各的特点，都有各自擅长解决的问题和不擅长解决的问题。（1）SGD随机

2020-12-12 11:45:49 284

空空如也

空空如也