机器视觉
lbaihao
zephyr,data structure, algorithm, protocol,darknet,architecture
展开
-
k-means 聚类
聚类与分类的区别分类:类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。属于监督学习。聚类:事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。聚类不需要对数据进行训练和学习。属于无监督学习。关于监督学习和无监督学习,这里给一个简单的介绍:是否有监督,就看输入数据是否有标签,输入数据有标签,则为有监督学习,否则为无监督学习。更详尽的解释会在后续博文更新,这里不细说。k-means 聚类聚类算法有很多种,K-Means 是聚类算法中的原创 2022-04-26 20:22:15 · 917 阅读 · 0 评论 -
图像工具软件
(1) RawViewer.exe(2)Image2lcd.exe(3) JMem.exe JLink(4) YUVPlayer.exe(5)vooya.exe(6)Elecard StreamEye Tools eseye_u.exe pyuv.exe原创 2022-03-22 08:31:02 · 442 阅读 · 0 评论 -
图像数据转换
def rgb2jpg():w = 256H = 256file = "rgb888.bin"f = open(file, "rb+")content_bytes = f.read()content_bytearray = bytearray(content_bytes)c = np.reshape(content_bytearray,[H,W,3])data = np.zeros((H,W,3),dtype=np.uint8)data[:,:,0] = c[:,:,2.原创 2022-02-10 17:18:17 · 2073 阅读 · 0 评论 -
zbar 二维码和一维码
https://blog.csdn.net/kucoffee12/article/details/88900476原创 2020-07-23 18:09:59 · 257 阅读 · 0 评论 -
【特征检测】Harris角点检测中的数学推导
简介本文主要是对Harris角点检测的数学公式进行推导,更加深入的掌握原理性的理论知识。预备知识椭圆的矩阵方程表示在高中课本中,我们学习到标准椭圆及其方程(如下图所示):其实,矩阵在运算中使用非常广泛,现将上述标准方程写成矩阵形式(方便接下来的处理):椭圆半轴与系数矩阵的关系 一个nxn的矩阵,转载 2017-12-28 10:55:57 · 706 阅读 · 0 评论 -
goodFeaturesToTrack——Shi-Tomasi角点检测
.Shi和C.Tomasi在1994年在其论文“Good Features to Track”中,提出了一种对Harris角点检测算子的改进算法——Shi-Tomasi角点检测算子,可以看到,Opencv中函数goodFeaturesToTrack就是直接取自他们论文的名字。goodFeaturesToTrack有比cornerHarris更多的控制参数,函数原型:转载 2017-12-28 13:59:45 · 1548 阅读 · 0 评论 -
【wav音频解析】之wavread函数的C++实现
摘要: 最近我在用C++写音频处理相关的功能实现,在此过程中有一些体会,总结出来供日后回顾,同时与大家分享,接受批评指正。C++实现wav音频文件的解析,就是先读取原始采样数据,每次读16字节,然后将16字节的16进制数字转化成十进制数,再转换成其补码,并归一化。转换时注意大小端和符号问题。 ...转载 2018-03-20 22:19:28 · 5650 阅读 · 10 评论 -
keras-yolo3 笔记(一)
项目地址:https://github.com/qqwweee/keras-yolo3论文:YOLOv3: An Incremental Improvementkeras-yolo3IntroductionA Keras implementation of YOLOv3 (Tensorflow backend) inspired by allanzelener/YAD2K.Quick StartD...原创 2018-07-13 14:49:31 · 4251 阅读 · 0 评论 -
深度学习算法之YOLOv2
一. 久违的新版本 YOLO 问世已久,不过风头被SSD盖过不少,原作者自然不甘心,YOLO v2 的提出给我们带来了什么呢? 先看一下其在 v1的基础上做了哪些改进,直接引用作者的实验结果了: 条目不少,好多Trick,我们一个一个来看: A)Batch Normalization(批量规范化) 先建立这样一个观点: 对数据进行预处理(统一格式、均衡...转载 2018-07-13 15:09:30 · 1270 阅读 · 0 评论 -
语音识别学习记录
1.使用pyinstaller可以方便的实现Py文件转exe文件,这里是它的manual: http://www.pythonhosted.org/PyInstaller/ 2.使用命令行:1)首先cmd进入要转换的py文件所在目录2)执行命令:pyinstaller myscript.py 即可3)可能你的工程包含多个py文件,只要在命令中指明入口所在的py文件就行4)...原创 2018-07-25 21:11:29 · 876 阅读 · 0 评论 -
FFT频谱分析原理
FFT频谱分析原理采样定理:采样频率要大于信号频率的两倍。N个采样点经过FFT变换后得到N个点的以复数形式记录的FFT结果。假设采样频率为Fs,采样点数为N。那么FFT运算的结果就是N个复数(或N个点),每一个复数就对应着一个频率值以及该频率信号的幅值和相位。第一个点对应的频率为0Hz(即直流分量),最后一个点N的下一个点对应采样频率Fs。其中任意一个采样点n所代表的信号频率:Fn...转载 2018-07-30 09:57:41 · 72019 阅读 · 3 评论 -
STFT和声谱图,梅尔频谱(Mel Bank Features)与梅尔倒谱(MFCCs)
最近小编在做ASC(Acoustic Scene Classification)问题,不管是用传统的GMM模型,还是用机器学习中的SVM或神经网络模型,提取声音特征都是第一步。梅尔频谱和梅尔倒谱就是使用非常广泛的声音特征形式,小编与它们斗争已有一段时间了,在此总结一下使用它们的经验。STFT和声谱图(Spectrogram)声音信号本是一维的时域信号,直观上很难看出频率变化规律。如果通过傅...转载 2018-07-30 10:58:56 · 4628 阅读 · 2 评论 -
音色与声谱图
泛音的种类和多少决定了音色为什么有的人声音听起来暗,有的人听起来亮?事实上即使是唱同一个音高,大家的音色也天差地别,差别就在泛音上了。一般来说1. 泛音越充分的声音越饱满。2. 低频泛音越充分的声音听起来越“厚实”,越“有力”。3. 高频泛音越充分的声音穿透力越强,声音听起来越“亮”,越“尖”。4. 高低频都有并且合理分布的声音,就是比较完美的声音。声乐理论里,一般把低...转载 2018-07-30 11:24:46 · 20082 阅读 · 5 评论 -
语音波形,截断的频域输出以及语谱图制作
语音可视化参考链接1 参考链接2 参考链接3今天我想复现一下,文中语谱图提取部分的代码 由于输入的语音有单通道和双通道之分,处理方式是单通道不变,双通道只取一个通道的信息。附上代码:import wave as weimport numpy as npimport matplotlib.pyplot as pltdef wavread(path): wavfile...转载 2018-07-30 11:40:46 · 1190 阅读 · 2 评论 -
Tensorflow卷积实现原理+手写python代码实现卷积
从一个通道的图片进行卷积生成新的单通道图的过程很容易理解,对于多个通道卷积后生成多个通道的图理解起来有点抽象。本文以通俗易懂的方式讲述卷积,并辅以图片解释,能快速理解卷积的实现原理。最后手写python代码实现卷积过程,让Tensorflow卷积在我们面前不再是黑箱子!注意:本文只针对batch_size=1,padding='SAME',stride=[1,1,1,1]进行实验和...转载 2018-08-12 21:54:08 · 1017 阅读 · 0 评论 -
【特征检测】FAST特征点检测算法
简介 在局部特征点检测快速发展的时候,人们对于特征的认识也越来越深入,近几年来许多学者提出了许许多多的特征检测算法及其改进算法,在众多的特征提取算法中,不乏涌现出佼佼者。 从最早期的Moravec,到Harris,再到SIFT、SUSAN、GLOH、SURF算法,可以说特征提取算法层出不穷。各种改进算法PCA-SIFT、ICA-SIFT、P-ASURF、转载 2017-12-28 10:39:20 · 1408 阅读 · 0 评论 -
【特征检测】FAST特征点检测算法
简介 在局部特征点检测快速发展的时候,人们对于特征的认识也越来越深入,近几年来许多学者提出了许许多多的特征检测算法及其改进算法,在众多的特征提取算法中,不乏涌现出佼佼者。 从最早期的Moravec,到Harris,再到SIFT、SUSAN、GLOH、SURF算法,可以说特征提取算法层出不穷。各种改进算法PCA-SIFT、ICA-SIFT、P-ASURF、转载 2017-12-28 09:37:41 · 341 阅读 · 0 评论 -
opencv3.0+VS2015+64位win7配置
首先,我们把所有用到的工具下载下来VS2015 看这里,http://news.mydrivers.com/1/439/439398.htm,我下载的是专业版。OPENCV3.0两个地址,http://opencv.org/downloads.html,官网;http://sourceforge.net/projects/openc转载 2017-12-27 15:51:37 · 334 阅读 · 0 评论 -
行人检测之DPM
DPM的详细原理可以参考本人http://blog.csdn.net/qq_14845119/article/details/52625426 DPM是继2008年提出以来,传统机器学习模式(非深度学习)下行人检测效果最好的算法。不论是召回率还是准确率都比Hog要好很多。当然,实际的运行速度经过cpu多线程加速后,大概200MS-300MS之间,未能满足实时场景的应用。经过gpu加转载 2017-11-17 14:28:24 · 686 阅读 · 0 评论 -
基于轮廓线索(Contour Cues)的实时行人检测
这是一篇基于传统机器学习的行人检测的博文,和现在的深度学习的效果和速度都不能相提并论,但是在深度学习之下,确实一个非常值得学习的行人检测的方法。与传统的HOG,DPM相比,该方法主要体现在速度快上,在VGA(640*480)输出下,达到了20fps的速度,并且是单线程,无GPU的条件,比HOG和DPM都要快,同时在测试中表现出了不俗的效果。 作者是新加坡南洋理工的,吴建鑫,转载 2017-11-17 14:37:48 · 829 阅读 · 0 评论 -
基于轮廓线索(Contour Cues)的实时行人检测
这是一篇基于传统机器学习的行人检测的博文,和现在的深度学习的效果和速度都不能相提并论,但是在深度学习之下,确实一个非常值得学习的行人检测的方法。与传统的HOG,DPM相比,该方法主要体现在速度快上,在VGA(640*480)输出下,达到了20fps的速度,并且是单线程,无GPU的条件,比HOG和DPM都要快,同时在测试中表现出了不俗的效果。 作者是新加坡南洋理工的,吴建鑫,转载 2017-11-17 14:49:27 · 535 阅读 · 0 评论 -
行人检测资源汇总
行人检测具有极其广泛的应用:智能辅助驾驶,智能监控,行人分析以及智能机器人等领域。从2005年以来行人检测进入了一个快速的发展阶段,但是也存在很多问题还有待解决,主要还是在性能和速度方面还不能达到一个权衡。近年,以谷歌为首的自动驾驶技术的研发正如火如荼的进行,这也迫切需要能对行人进行快速有效的检测,以保证自动驾驶期间对行人的安全不会产生威胁。1 行人检测的现状转载 2017-11-17 15:07:38 · 1190 阅读 · 0 评论 -
OpenCV学习笔记(二十七)——基于级联分类器的目标检测objdect
OpenCV支持的目标检测的方法是利用样本的Haar特征进行的分类器训练,得到的级联boosted分类器(Cascade Classification)。注意,新版本的C++接口除了Haar特征以外也可以使用LBP特征。先介绍一下相关的结构,级联分类器的计算特征值的基础类FeatureEvaluator,功能包括读操作read、复制clone、获得特征类型getFeatureType,分配转载 2017-11-18 15:01:21 · 753 阅读 · 0 评论 -
基础学习笔记之opencv(3):haartraining生成.xml文件过程
1.准备正负样本: 在上一讲http://www.cnblogs.com/tornadomeet/archive/2012/03/27/2420088.html 中,我们已经收集到了训练所用的正样本。下面就开始收集负样本了,负样本要求是:不能包含人脸,且图片大小也不需要归一化到正样本尺寸,只需比正样本尺寸大或者相等即可。建议负样本用灰度图,加快训练速度,且负样本一定不能重复,要增大转载 2017-11-18 15:05:22 · 282 阅读 · 0 评论 -
浅析人脸检测之Haar分类器方法:Haar特征、积分图、 AdaBoost 、级联
浅析人脸检测之Haar分类器方法一、Haar分类器的前世今生 人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来。 目前的人脸检测方法主要有两大类:基于知识和基于统计。Ø 基于知识的方法:主要利用先验知识将人脸看作器转载 2017-11-20 16:04:10 · 254 阅读 · 0 评论 -
关于Adaboos选择最优弱分类器过程的理解
特征的设计在此不做解释,随着研究的深入,很多学者丰富和改善了以前的那些特征,最原始的矩形特征为例:所谓的弱分类器其实是由特征f、阈值theta和一个决定不等号方向的p所决定的在此先不考虑p,简单谈谈我理解中的选择最优弱分类器的过程。在上述的特征中,第一中的特征值就是两个矩形的像素值之差,那么对于很多个训练样本,比如说现在有200幅正例转载 2017-11-21 10:37:20 · 2749 阅读 · 0 评论 -
图像识别中目标分割、目标识别、目标检测和目标跟踪方法
作者:Bihan Wen链接:https://www.zhihu.com/question/36500536/answer/67939194来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。(1)目标分割,应该是Target Segmentation,应该是data/image segmentation的一种。这里假定数据是图像,就如楼上说的,任务是原创 2017-11-16 09:55:33 · 5815 阅读 · 0 评论 -
浅析人脸检测之Haar分类器方法
[补充] 这是我时隔差不多两年后, 回来编辑这篇文章加的这段补充, 说实话看到这么多评论很是惊讶, 有很多评论不是我不想回复, 真的是时间久了, 很多细节我都忘记了, 无力回复, 非常抱歉. 我本人并非做CV的, 这两年也都没有再接触CV, 作为一个本科毕业的苦逼码工, 很多理论基础都不扎实, 回顾这篇文章的时候, 我知道其实有很多地方都是写的模棱两可, 加这个补充, 也是希望看这篇文章同学要带原创 2017-11-16 10:37:03 · 198 阅读 · 0 评论 -
AdaBoosting流程及数学证明
基本思想:通过级联弱分类器(分类能力较弱的分类器)来构造一个强分类器。训练准备:为了描述简洁,用典型的二分类问题进行阐述。 训练集: N个多维的特征向量 分类器池:L个弱分类器 m个分类器判别结果的线性组合: (1转载 2017-11-16 11:04:07 · 510 阅读 · 0 评论 -
ADABOOSTING 的理解
这里说说我对这个算法的理解:主要应用在人脸检测。haar特征 + adaboosting,人脸检测系统是一个级联的分类器系统,这里主要是讨论其中一个节点。大体流程如果: 首先准备正负样本,在一个训练强分类器H时,使用booststraping策略来进行样本的提取:从整体样本集合中,抽样n1 n个样本 针对抽样的集合训练分类器H1转载 2017-11-16 11:14:46 · 2073 阅读 · 0 评论 -
VSLAM 特征点提取
最新 | Magic Leap提出新技术:迈向几何型深度 SLAMhttp://www.sohu.com/a/160168358_642762http://blog.csdn.net/lmg2015/article/details/78407201https://www.cnblogs.com/ronny/p/4260167.html 图像局部特征点检测算法综述转载 2017-12-25 17:27:47 · 691 阅读 · 0 评论 -
DPM(Deformable Part Model)原理详解
写在前面:DPM(Deformable Part Model),正如其名称所述,可变形的组件模型,是一种基于组件的检测算法,其所见即其意。该模型由大神Felzenszwalb在2008年提出,并发表了一系列的cvpr,NIPS。并且还拿下了2010年,PASCAL VOC的“终身成就奖”。 由于DPM用到了HOG的东西,可以参考本人http://blog.csdn.net/转载 2017-11-17 14:27:40 · 1122 阅读 · 0 评论