- 博客(32)
- 收藏
- 关注
原创 基于半交互式的裂缝检测方法
裂缝的危害已深入经济社会发展的各个领域,比如交通运输领域中的公路路面裂缝,高速公路隧道壁裂缝等;工业产品领域中的光学玻璃裂缝,木材表面裂缝等等;其安全性检测直接关系到经济发展和安全等重大问题。裂缝虽然大多不足1mm,但是却是一种最常见和最重要的病害表现形式。它一方面预示着病害的出现;另一方面预示潜在的严重安全隐患,比如渗水等因素诱发深层次强度减弱而造成不可估量的损失;同时, 裂缝不及时处理, 将缩...
2020-05-28 11:42:44 2012 2
原创 行为识别模型探索
在施工场景中,一些违规操作总是会造成潜在的安全事故等。目前的违规防范主要采用人盯人的方式,这种传统方式主观性强,还造成严重的人力资源浪费。得益于计算机视觉和人工自能的发展,目前正在探索基于人工智能的异常行为识别模型研究,希望研究成果能切实的应用于真实的场景,解放人力成本。说到行为识别模型,在深度学习之前,iDT是最为经典的一种方法,利用光流场获取视频序列的一些轨迹,再沿着轨迹去提取类似HoF和Ho...
2019-11-07 14:22:31 2589 1
原创 多目标跟踪--统一跟踪框架论文解读
商汤等新出的多目标跟踪论文Multi-Object Tracking with Multiple Cues and Switcher-Aware Classification。该论文提出了一个融入单目标跟踪网络、ReID网络和数据关联的统一多目标跟踪(MOT)框架。单目标跟踪网络借鉴目前在VOT领域中的最新研究成果Siamese-RPN 用于捕获短期线索有助于补偿检测器由于物体遮挡造成的漏检,解决...
2019-08-30 09:02:13 1731
原创 施工场景下多目标跟踪
多目标跟踪乃是违规行为识别的前提与基础,只有在视频流中抽取出每一个目标的数据后才能定性去分析该目标的行为,而在复杂场景下的多目标跟踪又是一个极具挑战性的问题。总的来说,多目标跟踪这个领域得益于近来目标检测的研究成果进而取得了快速发展。融合目标检测做跟踪,即tracking-by-detection,是一个非常流行的方法,即在每一帧中使用目标检测器得出检测目标,然后再匹配关联不同帧中的目标得到目标的...
2019-08-19 15:45:42 1000
原创 施工场景下违规行为识别数据集
最近,转到了施工场景下的行为识别领域。该应用领域在技术上可拆分为两部分:视频跟踪和行为识别。这一周密集调研了文献,发现着实是一个大坑。其中的视频跟踪最近的各頂会论文出现最多的是单目标跟踪,而我们要解决的确是多目标跟踪,最近出的较好的能实用性的是deepSort;真实的施工场景中摄像头的远近,拍摄的遮挡,工人服装的统一,重叠,违规动作幅度的大小等都是巨大的挑战;行为识别方面最近出的论文较多,能实用性...
2019-07-17 14:30:38 3912 17
原创 基于3D卷积神经网络的视频质检
前段时间接了视频质检的项目,采用了传统的图像处理方法检测视频的抖动和模糊,检测准确率在86%左右。目前针对收集的大量珍贵视频数据,采用了深度卷积网络的方法进一步提升了检测准确率。视频监控系统,体积小且工作稳定,不仅为生产带来方便,如在一些较为恶劣的环境下可以代替人力进行监视控制,能节省大量人力资源成本;而且不会产生视觉疲劳等生理缺陷,正常情况下保证生产安全,提供客观性指导。而视频监控技术在各类各...
2019-07-09 11:37:22 2242 1
原创 Linux平台上离线编译安装OpenCV
OpenCV是做视觉的标配,由于工作电脑不能连网,因此只能离线安装。整个过程还比较顺利,写下整个过程,方便以后查看。1. 安装CMake工具在能联网的笔记本上 登陆 http://www.cmake.org/cmake/resources/software.html 找对对应操作系统的cmake的Binary Distribution,即已编译好的可执行版本。系统是64位,则下载cmake-3...
2019-03-08 15:31:07 4551 2
原创 脉冲涡流信号的大数据分析技术
最近经一朋友介绍揽下某油下面一个小项目,算是挣点外快。该项目主要是运用脉冲涡流检测原理实现对管道或其它铁磁材料等的缺陷检测,厚度测量等;而我要做的是根据海量的脉冲涡流信号数据和厚度标定数据建立/学习一个从信号到厚度的映射。大概花了两周时间:第一周调研脉冲涡流相关的资料和技术;第二周提想法并编码解决问题。截至今使用比较风靡的深度学习技术达到了不错的效果,后续会协助公司撰写/申请专利。脉冲涡流检测原...
2018-12-02 09:52:57 4572 2
原创 缺陷级评测指标
传统的精度、召回率 和F1已广泛用于模式识别和信息检索领域。一定程度上,它在视觉分割、检测等领域中为一种通用的评价标准。对应的PrePrePre、RecRecRec 和F1-measure(FFF) 在视觉领域通常是基于像素级定义,如下:Pre=TP/(TP+FP)Rec=TP/(TP+FN)F=2∗Pre∗Recall/(Pre+Rec)\begin{array}{c}Pre = TP/...
2018-11-30 11:13:37 1657
原创 模型优化方法小结
最近的研究设计并建立了一些优化模型,其中的一些优化方法值得总结。比如,当遇到如下模型: minUTU=I∥X−UTP∥2FminUTU=I‖X−UTP‖F2\mathop{min}_{U^TU=I}\|X-U^TP\|_F^2上述模型中UUU为正交矩阵,如何优化求解UUU呢?我们将优化的目标函数进行trace展开: ∥X−UTP∥2F=Tr(XTX)+Tr(PTP)−2Tr(XTUTP)...
2018-07-18 11:48:13 5264
原创 基于注意力机制的细腻度图像分类
细腻度图像分类相比普通的图像分类具有更大的挑战,因为在细腻度图像类别中类间差异往往只聚焦于很小的一个区域。比如在下图海鸥的3个品种中,差异仅仅体现在喙与脚;而在人类活动识别(human activity recognition)中的弹奏乐器与拿着乐器也仅仅体现在手和嘴上。针对这一类分类任务可采用强监督的学习方式,即根据下图中额外的bounding box信息去学习相应的模型;然而,一方面强监督的学...
2018-06-09 14:11:46 15943
原创 结合深度神经网络和随机场的图像语义分割
图像的语义分割无非就是像素级的操作,在像素上去学习监督/非监督的模型,然后去预测每一个像素的类别从而实现图像的语义分割。事实上,图像的高层语义信息是很难获取的,但是这个任务的目标是很明确的,就是给每个像素打上label。目前,深度学习技术在计算机视觉领域取得了很大成功;而图像的语义分割也借助深度学习技术实现了准确率的大幅提升。比如全卷积神经网络(FCN,Fully Convolutional Ne...
2018-05-31 16:30:20 3330
原创 直观理解概率图模型中的采样(sampling)技术
我们都知道,在概率图模型的推断中,精确推断方法通常需要很大的计算开销。因此,在现实应用中近似推断方法更为常用。这类方法一般分为2类:通过使用随机化方法完成近似,比如MCMC(Markov Chain Monte Carlo);使用确定性近似完成近似推断,比如变分推断。本文主要讨论采样技术,基本思想是直接计算或逼近某个变量的期望往往比推断概率分布更加容易。西瓜书里举了一个非常直观的例子,假定我们的目...
2018-05-17 16:41:12 6895
原创 序列异常检测
序列在现实世界中是非常常见的一种数据形式,即在时间维度上传感器采集的数据流。我们最常见的序列数据像语音,自然语言,视频等信号,它们的共同点就是有很强的上下文。一般而言,任何高级有效的模型在处理这种数据时都会考虑这种上下文关系,充分挖掘潜藏的时空相关性,以对数据进行建模,比如混合动态纹理模型。而异常呢,一般在不同场景中有不同的定义,比如一个心脏跳动的信号,在平稳中突然跳动。那么这个跳动就是异常,任何...
2018-05-13 16:30:02 4684
原创 交通信号灯识别的自主式学习系统
自动驾驶中一个核心模块的设计。其中算法层面涉及到对交通信号灯的检测与识别,前期对该模块进行了简单算法的设计,主体的识别框架如下图,主要思想是基于滑动窗思想和机器学习模型。当然为了进一步提升算法的效率,采用了基于信号灯颜色的特殊先验知识进行selective search,过滤掉大部分区域实现算法的加速。上述框架虽然能达到一定的识别率,但是依然面临两个严峻的挑战:对视频处理的实时性较差。上述框架对R...
2018-04-27 17:11:25 5572
原创 VS2013中C++类封装动态链接库
最近跟一商业公司合作,开发地铁场景中交通信号灯的检测模块。所以需要将检测模块类封装成动态链接库,提供给该公司。现将该简单的封装过程记录下来,以便日后查看。
2018-04-13 08:13:50 2933
原创 交通信号灯的检测与识别
交通信号灯的检测与识别是无人驾驶与辅助驾驶必不可少的一部分,其识别精度直接关乎智能驾驶的安全。一般而言,在实际的道路场景中采集的交通信号灯图像具有复杂的背景,且感兴趣的信号灯区域只占很少的一部分,如下图所示。针对这些难点,国内外的众多研究者提出了相应的解决方案。总的来说,大多基于传统的图像处理方法;但目前也有用强学习能力的卷积神经网络去进行识别,但这类方法往往需要大量的训练样本避免过拟合的风险。
2018-04-11 09:32:34 29046 10
原创 条件随机场(Conditinal random field)
条件随机场(Conditinal random field, CRF)是给定一组随机变量条件下另一组输出随机变量的条件概率分布模型,其特点是假设输出随机变量构成马尔科夫随机场。即输出变量之间存在成对马尔科夫性,局部马尔可夫性和全局马尔可夫性。成对马尔可夫性:假设u,vu,v为无向图GG中任意两个没有边连接的节点,那么在给定其它剩余节点的条件下随机变量Yu,YvY_u,Y_v是条件独立的。局部马尔可
2017-12-21 10:40:10 1118
原创 计算机视觉-混合动态纹理模型(Mixtures of Dynamic Textures)
在计算机视觉领域,混合动态纹理模型(Mixtures of Dynamic Textures, MDT)常用于视频帧序列建模。比如对帧序列的分割,局部或全局的异常事件检测。
2017-12-09 20:58:44 3429 2
翻译 (翻译)Dirichlet-based Histogram Feature Transform for Image Classification
基本信息:Dirichlet-based Histogram Feature Transform for Image Classification,作者:Takumi Kobayashi, National Institute of Advanced Industrial Science and Technology,发表于CVPR2014。
2017-11-02 11:20:33 651
转载 计算机视觉、机器学习相关领域论文和源代码大集合
计算机视觉、机器学习相关领域论文和源代码大集合。注:下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。
2017-11-01 09:18:44 308
原创 计算机视觉 - 字典学习
在稀疏编码中,字典的学习至关重要。监督的字典学习方法大致可以分为3类。第一类为学习出针对所有信号的一个统一字典(universal dictionary)。第二类方法为针对每一类别的信号学习出相应的子字典(category-specific dictionary)。第三类即为前两类的结合。
2017-11-01 08:55:09 2879
原创 进阶优化算法
本文主要讨论在优化模型求解中用到的高级优化算法,这些算法基于常见的优化算法思想,采用一些非常巧妙的技巧,而使得算法到达更快的收敛等特点。这些高级优化算法也只限定于特定的模型求解,下面将对其进行简单总结。
2017-10-30 10:40:53 1101
原创 计算机视觉 - 图像编码
图像编码在计算机视觉领域中一直是一个严峻的挑战,至少在深度学习火之前。在众多的视觉任务中,比如识别,检测,跟踪等,都需要提取出辨别的特征表示能更好的运用于后续的模型中。一般来说,最浅层的特征是图像的像素灰度。这种原始的灰度具有很少的语义信息,这严重限制了图像表示的描述能力。因此,大量的纹理特征,结构模式和边缘信息,如SIFT,HOG,LBP等得到了发展。
2017-10-12 17:05:27 6591
原创 计算机视觉 - 相关性建模
相关性建模方法在计算机视觉领域里得到了广泛应用。比如,在目标检测领域,该类方法主要考虑像素间的空间领域关系;在视频建模中,考虑帧之间的相关性;在细腻度图像分类中,考虑类别标签间的结构相关性;该类方法在样本不均衡下的模型建立中同样适用,充分挖掘类别间的相关部分等等。
2017-10-10 20:49:00 1328
原创 变分推断(Variational Inference)-mean field
变分推断的实质就是使用已知简单分布来逼近需要推断的复杂分布,并通过限制近似分布的类型,从而得到一种局部最优,但具有确定解的近似后验分布。
2017-09-24 16:00:34 13894 1
原创 Lagrange multipliers - 拉格朗日乘子法
Lagrange multipliers - 拉格朗日乘子法拉格朗日乘子法是一种寻找多元函数在一组约束下的极值方法。通过引入拉格朗日乘子,可将多约束的最优化问题转化为多变量的无约束优化问题求解。本文主要讲解其中的数学原理,并引入KKT条件。
2017-08-27 23:14:43 7679 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人