计算机视觉
文章平均质量分 73
记录计算机视觉学习中的心得
pzb19841116
大龄男讲师
展开
-
Dual-Branch Cross-Attention Network for Micro-Expression Recognition with Transformer Variants阅读笔记
另一方面,光流信息提供了帧与帧之间的连续性信息,有效地保持了ME序列的一致性,减少了噪声和不连续的干性。为了方便不同信息类型之间的有效交互,我们设计了交叉注意力块( cross attention block,CAB ),它是一种用于不同特征表示之间交互和信息传播的注意力机制。CNN的缺点:通过分层与共享权重的卷积核,CNN倾向于局部信息,容易忽略上下文的关联性和全局信息的作用。传统手工方法其特征表示是场景受限的,缺乏对ME细微差别的关注,这是传统手工特征的缺陷。原创 2024-08-18 19:34:04 · 681 阅读 · 1 评论 -
Facial Micro-Expression Recognition Based on DeepLocal-Holistic Network 阅读笔记
针对微表情短暂且强度低的特点,微表情数据在空间和时间域中都是稀疏的。因此,借鉴Wang等人的思想,将微表情中的细微动作信息视为所需的E,将噪声视为A,采用RPCA从微表情帧中提取稀疏信息,然后将提取的信息馈送到RPRNN,学习微表情的稀疏和整体特征。然而,微表情样本数量少且微表情的微妙短暂特性限制了深度学习与微表情识别方法的结合,因此,如何有效学习微表情特征对于进一步提高性能至关重要。深度本地-整体网络通过HCRNN和RPRNN的融合,捕获了局部-整体、稀疏-丰富的微表情信息,并提高了微表情识别的性能。原创 2024-04-10 11:40:01 · 972 阅读 · 0 评论 -
Transformers in Vision:A Survey 阅读笔记
Visual Grounding with Transformer[206]具有编码器-解码器架构,其中视觉标记(从预训练的CNN模型中提取的特征)和文本标记(通过RNN模块解析)在编码器的两个不同分支中并行处理,具有跨模态注意力,以生成文本引导的视觉特征。尽管有人可能认为像Transformer模型这样的架构应该是通用的,可以直接应用于各个领域,但我们注意到,预训练这些模型所需的高计算成本和时间成本需要新的设计策略,使它们在视觉问题上的训练更具成本效益。原创 2024-04-03 16:41:53 · 1093 阅读 · 0 评论 -
Integrating VideoMAE based model and Optical Flow for Micro- and Macro-expression Spotting 阅读笔记
VideoMAE 是基于视频掩模自编码器的自监督视频预训练方法,旨在利用视频的时间维度作为静止图像的时间演变,并解决视频中的语义冗余和时间相关性。如图1中的总体框架图所示,我们的方法分为3个部分:数据集预处理、基于VideoMAE的自监督训练、区间融合和后处理策略。该方法的目标是自动识别微表情和宏观表情。我们通过训练多个宏观和微观表情模型,采用不同的细粒度和生成不同长度的表情片段,探索最佳的组合方法。一般而言,与微表情相关的任务主要包括两个方面:长视频中的微表情识别和微表情片段中的情绪识别。原创 2024-03-26 09:57:05 · 692 阅读 · 0 评论 -
Three Stream Graph Attention Network using Dynamic Patch Selection for the classification ofME 阅读笔记
对于图网络的第一流,节点特征向量是面部地标点的 x 和 y 位置坐标,用于理解每个地标点相对于其先前位置的运动变化。在计算了每个关键点上的光流特征矩阵后,对特征矩阵进行了零填充,使其变成10×10的补丁大小,以便简化计算。光流幅度特征向量是图网络的第二个流的输入,而光流方向特征向量是图网络的第三个流的输入。然后,根据节点的注意力分数以及所选的池化比率 k,选择保留在图中的前 k 个节点。1.微表情具有微妙而短暂的行为特征。基于保留节点及其之间的连接,创建新的特征矩阵和新的邻接矩阵,形成新的图结构。原创 2024-03-13 13:48:00 · 701 阅读 · 0 评论 -
3D-CNN FOR FACIAL MICRO-AND MACRO-EXPRESSIONSPOTTING ON LONG VIDEO SEQUENCES USING TEMPORALORIEN阅读笔记
漂移误差是光流方法的一个挑战,尤其是在需要准确追踪物体长时间运动的应用场景中,如高帧率宏表情的分析。这有助于捕捉图像中的局部特征。它的主要作用是通过去除信号中的高频噪声,同时保留低频信号,来平滑或清除信号中的不需要的频率成分。我们提出了一个基于3D-CNN的两流网络(如图1所示),利用ME和MaE的持续时间差异,通过在每个流中使用不同数量的跳帧来使一个网络对ME更敏感,另一个对MaE更敏感。我们注意到先前的尝试缺乏基于持续时间的分析,因此提出了一个基于两者持续时间差异的两流网络,用于微表情和宏表情的识别。原创 2024-03-12 06:03:04 · 829 阅读 · 0 评论 -
Facial Micro-Expressions:An Overview 阅读笔记
ME生成是ME分析的新方向,尽管当前生成的ME质量尚不够逼真,但进一步的研究预计将在其他ME分析方面发挥作用,如MER、ME检测和ME AU检测,同时也可用于增强现实、人机交互等领域。早期的自发微表情(ME)数据集主要包含前方的2D视频,因为这相对容易收集和分析,导致大多数现有的ME方法只能分析前方面部,并无法处理现实世界应用中的挑战,如光照变化、遮挡和姿态变化。为了在长视频中区分MaEs和MEs,提出了基于频率的ME定位方法,通过利用频率域中的信息来定位ME序列中的顶点帧,这可以反映面部变化的速率。原创 2024-03-06 10:59:02 · 866 阅读 · 0 评论 -
MESNet:A Convolutional Neural Network forSpotting Multi-Scale Micro-ExpressionIntervals 阅读笔记
通过多尺度分析,如不同长度的归一化或多尺度视频采样,基于间隔的定位方法可以适应和检测不同长度的ME片段,并更好地区分ME和其他类型的面部运动。每个子网络相当于在视频上滑动的固定长度窗口,其输出是一组概率,表示与滑动窗口对应的视频片段属于ME的可能性。目前的研究仍然面临一个挑战,即如何从有限的数据中有效地提取或学习最具代表性的时空特征,从而准确地定位长视频中的ME时间位置。微表情研究初期,仅考虑在收集微表情样本时仅记录发生微表情时的视频片段,即所谓的短视频,包括微表情发生前几帧和发生后几帧。原创 2024-03-02 14:23:46 · 1011 阅读 · 0 评论 -
Data Leakage and Evaluation Issues inMicro-Expression Analysis 阅读笔记
碎片化指的是评估协议或方法的分散、零散,导致评估过程不一致或无法比较不同模型的性能。为了解决这个问题,作者梳理了常见的陷阱,提出了一个新的标准化评估协议,使用了超过2000个微表情样本的面部动作单元,并提供了一个实现标准化评估协议的开源库。在训练过程中使用测试数据的信息可能导致较大的正向偏差,但这种正向偏差是误导性的,不代表可泛化的性能,特别是当一个折叠只是一个单独的主体时。然而,最近我们注意到了一个令人担忧的趋势,即出现了极高但不可靠的性能,接近完美表现,并在分析可用源代码时出现了潜在的评估问题。原创 2024-02-27 13:00:05 · 573 阅读 · 0 评论 -
Geometric Graph Representation with Learnable Graph Structure and Adaptive AU Constraint 阅读笔记
然而,一方面,现有的基于特征点的图聚合动态信息的工作,如光流和放大的形状特征,仍然需要花费大量的计算成本来提取这些特征。相反,人脸特征点是一种更紧凑的模态,可以为MER保留具有判别性的几何特征,并取得了良好的性能。总体而言,在较早的层中,AAU损失约束模型侧重于从人脸特征中学习高层的AU特征,而在较深的层中,则侧重于从高层的AU特征中学习高层的ME特征。我们提供了一种简单高效的方法,直接将基于特征点坐标的几何特征作为节点特征,而不是提供复杂且昂贵的外观特征或不易获取的AU特征。原创 2024-02-22 10:56:04 · 574 阅读 · 0 评论 -
CMNet:Contrastive Magnification Network for Micro-Expression Recognition 阅读笔记
随机灰度,这个方法是将图像转换为灰度图,并且这个转换的过程是随机的。在我们的方法中,我们采用了这个测试来校准提取的强度线索,以符合所建立的原型的变化。获取负样本的三种方法,第一种是全都取,第二种的相同的概率抽取,第三种先计算锚定帧与其他帧之间的差异,再将差异通过softmax转换成概率。作为强度的一种表示,特征向量被独立地提取出来,并受到一个损失的约束,在这个过程中,网络实现了强度增强。AAAI 2023的一篇文章,东南大学几位老师的工作,用于做微表情识别中的运动增强工作, 以下是阅读时记录的笔记。原创 2024-02-19 22:49:41 · 1045 阅读 · 0 评论 -
深度视觉目标跟踪进展综述-论文笔记
尽管以上的双路网络方法在视频目标跟踪中取得了很大的成功,但是仍然存在缺陷,缺少在线更新过程.MemTrack、Meta-Tracker、Re2EMA、UpdateNet和GradNet等, 提出了不同的模板更新算法。双路网络框架(SiamFC),此方法利用卷积网络提取目标模板和搜索区域的特征,然后再进性相关操作生成响应图,其中响应图上的峰值点就是目标所在的位置。深度学习提取特征的特点是,高层的语义特征对于目标的抽象表达能力很强,而低层的模型特征擅长刻画目标的纹理、形状等底层信息.。原创 2024-01-25 11:31:35 · 760 阅读 · 0 评论 -
基于深度学习的视觉目标跟踪进展综述
尽管以上的双路网络方法在视频目标跟踪中取得了很大的成功,但是仍然存在缺陷,缺少在线更新过程.MemTrack、Meta-Tracker、Re2EMA、UpdateNet和GradNet等, 提出了不同的模板更新算法。双路网络框架(SiamFC),此方法利用卷积网络提取目标模板和搜索区域的特征,然后再进性相关操作生成响应图,其中响应图上的峰值点就是目标所在的位置。深度学习提取特征的特点是,高层的语义特征对于目标的抽象表达能力很强,而低层的模型特征擅长刻画目标的纹理、形状等底层信息.。原创 2023-11-28 16:00:14 · 383 阅读 · 0 评论 -
无人机自主飞行实战入门-第一课(简介)
传统飞控基于STM32架构设计,无法满足更智能功能所需的计算量,飞控是为了无人机位姿控制所设计,人类操控依然in the loop。旋翼与固定翼的结合体,通过旋翼部分完成起降,在实际工作阶段使用固定翼动力模型完成飞行任务。• 读取飞控输出的 PWM 脉宽调制信号 , 根据收到的PWM信号调整换相频率,从而驱动电机完成速度的转换。以螺旋桨旋转作为升力的主要提供办法,通过调整螺旋桨转速来维持无人机姿态的无人机。• Arduino 开源飞控,是由六位意大利交互设计学院的同学,于2005年开发创办开发。原创 2023-08-26 09:27:43 · 847 阅读 · 0 评论 -
从零实战SLAM-第十课(回环检测与建图)(完)
验证两帧之间的相似度,有以下几种常用的策略,其中基于外观的方法是主流,核心在于衡量两帧图像之间的相似度。SLAM的前段和后端都存在误差,因为建图与定位是耦合的,所以整个误差会积累。➢ 对每一个样本,计算与每个中心点之间的距离,取最小的作为它的归类;➢ 思路:相邻关键帧是相似的,而回环的相似度应该约等于相邻关键帧。BoW的字典生成问题亦属于其中之一,N个特征点,归为k个单词。回环检测是通过检测出之前去过的地点,对预测的轨迹进行修正。➢ 只看 Word 的有无,无视 Word 的顺序。原创 2023-08-17 12:08:13 · 477 阅读 · 0 评论 -
从零实战SLAM-第九课(后端优化)
渐进式的作用是根据观测的结果,修正自己对位姿的估计。没有观测,则随着机器人的移动,自身的位姿误差会越来越大。在七月算法报的班,老师讲的蛮好。后端的目标:从带噪声的数据估计内在状态——状态估计问题。在SLAM中使用Bundle Adjustment,用来做关键帧和地图的管理。➢ 保持当前状态的估计,在加入新信息时,更新已有的估计(滤波)➢ 给定一定规模的数据,计算该数据下的最优估计(优化)则k时刻的位姿,与原始位姿、运动序列和观测序列有关。其中,卡尔曼滤波用在线性模型、高斯噪声的情况之下。原创 2023-08-16 13:47:16 · 591 阅读 · 0 评论 -
从零实战SLAM-第八课(非特征点的视觉里程计)
光流: 追踪源图像某个点在其他图像中的运动。本质→估计像素在不同时刻图像中的运动。➢ 每次使用了 Taylor 一阶近似,在离优化点较远时效果不佳,往往需要迭代多次。在七月算法报的班,老师讲的蛮好。❑ 稀疏光流:计算部分像素运动 ---- Lucas Kanade。❑ 稠密光流:计算全部像素运动 ---- Horn Schunck。➢ 要使优化成立,必须保证从初始估计到最优估计中间的梯度一直下降。➢ 可以用于跟踪图像中的稀疏关键点的运动轨迹。➢ 半稠密直接法:使用部分梯度明显的像素。原创 2023-08-15 17:47:23 · 974 阅读 · 0 评论 -
从零实战SLAM-第七课(多视角几何)
其中,P为三维空间中的一个路标,P在图像𝐼1与𝐼2的投影: 𝑝1, 𝑝2;𝑂1𝑃,𝑂2𝑃在对方图像上的投影: 𝑒2𝑝2(𝑙2),𝑒1𝑝1(𝑙1);PnP的作用:已知3D点的空间位置和相机上的投影点,求相机的旋转和平移(外参)。❖ 如果匹配的是 RGB-D图,得到 3D-3D 间的关系 ----ICP。❖ 如果只有两个单目图像,得到 2D-2D 间的关系 ----对极几何。❖ 如果匹配的是帧和地图,得到 3D-2D 间的关系 ----PnP。Epipolar Plane: 𝑂1𝑂2𝑃 ----极平面。原创 2023-08-15 10:31:43 · 235 阅读 · 0 评论 -
从零实战SLAM-第六课(特征点匹配)
4. 在选取的圆上,若有连续的𝑁个点的亮度大于𝐼𝑝 + 𝑇或小于𝐼𝑝 − 𝑇 :像素𝑝:特征点(𝐹𝐴𝑆𝑇 − 9、𝐹𝐴𝑆𝑇 − 11、𝐹𝐴𝑆𝑇 − 12)其中SLAM用的最多的是ORB,其他几个的速度都太慢,无法满足实时性。计算了特征点的主方向,为后续的BRIEF 描述子增加了旋转不变特性;特征点:能够在其他含有相同场景或目标的相似图像中以一种相同的或至少非常相似的不变形式表示图像或目标。Efficiency: 同一图像中,特征点的数量应远小于像素的数量。本质是通过连续两帧的图像,估算相机位姿的变化。原创 2023-08-14 17:31:47 · 187 阅读 · 0 评论 -
从零实战SLAM-第五课(最小二乘法)
在七月算法报的班,老师讲的蛮好。所谓的图优化,就是把一个常规的优化问题,以图(Graph)的形式来表述。比如机器人在空间中移动,并观察几个路标的,可以简化出一个图。图优化的作用就是将其抽象成一个图结构,用图的形式描述这个问题。首先是用平方和来衡量设计的模型与实际数据之间的差异。批量法:一次性给定所有的数据,以此估计所有的变量。SLAM中的两个关键模型,运动模型与观测模型。牛顿法与高斯牛顿法的区别在增量方程。优化的目的就是拟合出最理想的轨迹。,感兴趣的同学可以学习一下。L-M法与高斯牛顿法的区别。原创 2023-08-14 12:00:54 · 88 阅读 · 0 评论 -
从零实战SLAM-第四课(相机成像及常用视觉传感器)
是指成像过程中所产生的图像像元的几何位置相对于参照系统(地面实际位置或地形图)发生的挤压、伸展、偏移和扭曲等变形,使图像的几何位置、尺寸、形状、方位等发生改变。内参矩阵通过相机标定即可获取,或出厂时厂家提供,SLAM需要解决的是几个外参矩阵的计算。图像中的一个点,世界坐标系上一条射线上的点均匹配,所以说丢失了距离信息。相机的内参矩阵,用于计算世界坐标系与像素坐标系之间的转换。世界坐标系、相机坐标系与像素坐标系之间的关系。双目相机的原理及计算距离的方法。图像变形与畸变的分类。原创 2023-08-14 09:57:05 · 830 阅读 · 0 评论 -
从零实战SLAM-第三课(李群与李代数)
SO(3) 和 SE(3) 只有定义良好的乘法,没有加法,所以难以进行取极限、求导等操作。问题出现在这里,当做优化时,对矩阵进行求导,但是变换矩阵和旋转矩阵加个deltaR,结果不是变换矩阵(因为对加法不封闭)其中Xk-1为上一个时刻的位置,Uk为当前时刻的操作,Xk为当前的位置,Wk为噪声。回到之前的问题,矩阵R无法求导,因为加上deltaR,就不是旋转矩阵和平移矩阵了。群的定义:群(G)是一种代数结构,集合(A)+运算(·): 𝐺 = (𝐴,·);反对称矩阵是指,对角线两侧元素的绝对值相同,符号相反。原创 2023-08-12 10:43:22 · 139 阅读 · 0 评论 -
从零实战SLAM-第二课(SLAM中的基础数学)
向量的内积,也叫做点乘,是逐点相乘后累加,最终结果是一个标量,物理意义是一个向量在另一个向量上的投影。当某一个轴旋转90°,有两个轴的对应平面重合,则此情况下两个旋转的效果是一样的,这种情况叫做万向锁。为了避免万向锁对旋转计算的影响,SLAM中一般使用四元数来提起欧拉角描述旋转,当然本质是一样的。坐标系的变换包括平移和旋转,平移是对原点的平移,旋转是绕着三个轴旋转。外积,也叫做叉乘,两个向量拼起来成,结果是一个矩阵,物理意义是旋转。假设有一个旋转轴为n,角度为θ的旋转,显然,它对应的旋转向量为θn。原创 2023-08-11 22:20:26 · 208 阅读 · 0 评论 -
从零实战SLAM-第一课(SLAM概览)
SLAM的目的是同步估算出机器人的位姿信息并对环境建图。回路检测的作用时通过检测出之前出现过的场景,判断出走过的路径是一个环路,这样可以消除之前轨迹产生的误差。问题的特点是机器人的位姿和路标的位置都是世界坐标系下的绝对值,但是所有的测量值都是相对值。视觉里程计的作用就是通过连续两帧之间的时差,反向计算出相机位姿变化的情况。1.机器人的轨迹和地图都是未知的, 对姿态和地图的估计误差会累积;2.多帧检测的路标之间的映射关系未知,映射错误会导致后续的错误。如果要实现机器人的全自动化,SLAM是一个基础的问题。原创 2023-08-11 12:53:47 · 147 阅读 · 0 评论 -
无人驾驶实战-第二课(ROS编程)
ROS不是真正的操作系统,而是一种系统软件框架,该框架使用了流行的面向服务(SOA)的软件技术,通过网络协议将节点间数据通信解耦。一个节点是ROS程序包中的一个可执行文件,ROS节点可以使用ROS客户库与其他节点通信。ROS程序的最小组织是Package,Package是ROS系统中最底层最基本的组织,里面存放各种文件:库、工具、可执行文件等.原创 2023-07-31 20:44:32 · 298 阅读 · 0 评论 -
无人驾驶实战-第一课(自动驾驶概述)
这一部分相当于人的手和脚 传统汽车的这些控制由液压系统和真空助力泵协助完成,自动驾驶汽车的线控需要用电控化的零部件来完成,如电子液压制动系统 林肯MKZ拥有完善的电气化设备和接口。为自动驾驶汽车与人类的责任概念提供具体可衡量的参数,并通过对所有记录在案的交通事故所涉及的行为和环境进行分析统计,为自动驾驶汽车界定了一个可计量的“安全状态”输出:方向盘、油门 实现对无人车的控制,我们需要知道踩刹车和减速的关系、踩油门和加速的关系等,当无人车拿到一些控制学参数后,通过电脑对无人车的控制。原创 2023-07-30 22:00:36 · 1125 阅读 · 0 评论 -
Micro-expression recognition: an updated review of current trends,challenges and solutions 论文笔记
一篇微表情识别的综述阅读笔记原创 2022-11-16 22:26:24 · 608 阅读 · 2 评论 -
Deep Gait Recognition: A Survey 阅读笔记
摘要:Deep learning has reshaped the research landscape in this area since 2015 through the ability to automatically learn discriminative representations.深度学习引入步态识别是2015年,好处是可自动学习具有高可辨识性的表征。1.Introduction 简介Gait information can be captured using...原创 2022-02-12 17:51:37 · 2865 阅读 · 0 评论 -
Linux环境下Darknet的安装与测试
1.下载Darknet源码sudo git clone https://github.com/pjreddie/darknet2.编译Darknet源码cd darknetmake3.下载权重文件yolov3.weights,放入到darknet文件夹下下载地址:https://pjreddie.com/media/files/yolov3.weights4.修改cfg文件夹下的yolov3.cfg文件,原文件是训练模式,需要改成测试模式。具体修改方法是,打开Tes原创 2021-08-03 11:35:21 · 1336 阅读 · 0 评论 -
在 Jetson Nano 上安装 Realsense D455 运行环境的方法
1.连接D455到JetsonNano的USB接口上2.系统右上角“AboutthisComputer”,查看系统的Ubuntu版本号3.注册publickey sudo apt-key adv --keyserver keys.gnupg.net --recv-key F6E65AC044F831AC80A06380C8B3A55A6F3EFCDE || sudo apt-key adv --keyserverhkp://keyserver.ubuntu.com...原创 2021-07-16 15:50:09 · 1342 阅读 · 4 评论 -
《深度学习之PyTorch物体检测实战》读书笔记(三)网络骨架Backbone
经典的BackboneVGG:VGG的网络结构图VGG的特点是采用五组卷积核三组全连接,最后使用Softmax做分类。每次经过池化层后特征图的尺寸缩小一倍,而通道数增加一倍(除最后一个池化层)。VGG摒弃了55的卷积层,而是采用了两个33的卷积层进行堆叠。在保证相同感受野的情况下,降低了参数量,并且提升了网络的学习能力(多了一个非线性激活函数)。Inception并行多个不同尺寸的卷积运算与池化,然后拼接起来。后续版本加入了11的卷积,用于减少通道数,降低网络参数V2 版本引入了BN.原创 2021-04-21 18:54:38 · 265 阅读 · 0 评论 -
《深度学习之PyTorch物体检测实战》读书笔记(二)神经网络的基本组成
第二章是Python基础,笔记省略深度学习中常见的各种层卷积的本质是用卷积核的参数来提取数据的特征,通过矩阵点乘运算来得到结果。激活函数层的作用是为网络引入非线性,提升整个网络的表达能力。Sigmoid函数Sigmoid可以用来做二分类,但计算量较大,且容易出现梯度消失的现象。ReLU函数计算简单速度快。Leaky ReLUctant函数效果没有ReLU好。Softmax函数用于多分类问题。池化层用于降低特征图的参数量,提升计算速度,增加感受野,原创 2021-04-21 10:37:55 · 176 阅读 · 0 评论 -
《深度学习之PyTorch物体检测实战》读书笔记(一)浅谈物体检测与PyTorch
开头的话最近在做物体检测,遍寻资料,发现这本书写得蛮不错。条理清楚,不是资料的堆砌,一看作者就是这方面的行家,貌似是北航的学霸。强烈推荐大家购买该书,支持作者。第一章 浅谈物体检测与PyTorch非深度学习的基础知识及安装等步骤都没有记录人工智能、机器学习与深度学习之间的关系。人工智能的分类。弱人工智能(Artificial Narrow Intelligence,ANI):擅长某个特定任务的智能。强人工智能(Artificial General Intelligence,ASI):像原创 2021-04-17 11:20:26 · 479 阅读 · 2 评论 -
CUDA版本OpenCV的编译方法
CUDA版本OpenCV的编译方法VS2013 + OpenCV3.4.0 + CUDA10.1 + CMake 3.15.5 安装CUDA 从英伟达官网下载CUDA安装程序,https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exenetwork这里选的是10.1版本(官网现在是10.2版本了原创 2021-04-13 20:52:11 · 2154 阅读 · 0 评论 -
《机器视觉表面缺陷检测综述》论文解读
最近在搞工业检测的项目,看到一篇表面缺陷检测的综述文章。论文发表在《中国图像图形学报》,介绍的较为全面,对主要内容作了摘抄和整理,分享给大家0.引言美国机器人工业协会(RIA)对机器视觉下的定义为:“机器视觉是通过光学的装置和非接触的传感器自动地接收和处理一个真实物体的图像,以获得所需信息或用于控制机器人运动的装置”。机器视觉检测系统通过适当的光源和图像传感器(CCD 摄像机)获取产品的表面图像,利用相应的图像处理算法提取图像的特征信息,然后根据特征信息进行表面缺陷的定位、识别、分级等判别和统计、存储原创 2021-04-09 17:13:08 · 2383 阅读 · 1 评论 -
解决报错 OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized 【转】
报错信息:OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized(py38) D:\Pycharm\Yolov5_DeepSort_Pytorch>python track.pyNamespace(agnostic_nms=False, augment=False, classes=[0], conf_thres=0.4, config_deepsort='deep_s.转载 2021-04-09 09:00:10 · 484 阅读 · 0 评论 -
OpenCV编译CUDA模块face_landmark_model.dat下载失败的解决方法
在用CMake配置OpenCV编译工程时,会从网上下载一个face_landmark_model.dat的文件,该文件应该是人脸检测用到的数据文件。由于文件较大,下载速度较慢,经常导致配置失败。解决办法是如下,亲测有效1.从下面链接中下载好对应的文件(用迅雷下载速度很快)https://raw.githubusercontent.com/opencv/opencv_3rdparty/8afa57abc8229d611c4937165d20e2a2d9fc5a12/face_landmark_原创 2021-04-08 14:22:45 · 4796 阅读 · 8 评论 -
windows下OpenCV扩展模块(Extra Contrib)配置时的“Invalid escape sequence \o“解决方法
在编译OpenCV扩展模块时,configure总是报错,如图所示:后面查资料才知道,这里的扩展模块地址,不能直接复制粘贴,需要点击右边按钮选择对应的文件夹,重新点击configure就可以了选择扩展模块地址,并configure,成功了...原创 2021-04-07 11:21:27 · 390 阅读 · 0 评论 -
Windows下Qt开发OpenCV的开发环境配置
电脑环境windows 10 64位+VS2013OpenCV3.4.11.安装Qt这里安装的是2.打开OpenCV的Qt工程,修改工程文件在工程文件*.pro中配置OpenCV的头文件目录和lib文件目录及文件名INCLUDEPATH += D:/opencv3.4.1/build/install/includeCONFIG(debug, debug|release): {LIBS += -LD:/opencv3.4.1/build/install/...原创 2021-03-30 09:36:28 · 133 阅读 · 0 评论 -
基于大恒相机的VS工程配置
1.开发主机上需安装大恒的开发工具软件(如图所示,版本号可能有不同),安装完成后桌面上会显示如下图标。2.新建工程,选择Visual C++下的“Win32控制台应用程序”,工程名自取,3.点击确定后,进入应用程序向导,点击下一步4.在程序设置页,勾选“空项目”,并点击“完成”。5.进入工程后,在解决方案资源管理器中,右键点击工程名,选择属性。6.首先选择“平台”,64位则选择X64,平台选错会出现很多莫名其妙的编译错误,没必要深究。...原创 2021-03-22 17:50:29 · 1297 阅读 · 3 评论