视觉CV
文章平均质量分 62
椒椒。
仙女学习,天使落泪。
展开
-
改进 YOLO V5 的密集行人检测算法研究(论文研读)——目标检测
论文研读:yolov5行人目标检测原创 2023-03-01 15:57:18 · 4541 阅读 · 5 评论 -
(论文研读)A Video Key Frame Extraction Method Based on Multiview Fusion-————一种基于多视图融合的关键帧抽取方法
论文研读原创 2023-02-28 18:16:23 · 940 阅读 · 1 评论 -
AttributeError: module ‘ssl‘ has no attribute ‘SSLSocket‘或者OpenSSL SSL_read: Connection was rese
bug解决原创 2023-01-17 15:16:09 · 1080 阅读 · 0 评论 -
ocr表格识别(四)——文本检测DBnet原理及其实现
文本检测模型DBNET代码实现原创 2022-11-03 16:51:58 · 3170 阅读 · 0 评论 -
OCR表格识别(三)——文本检测与文本识别理论学习
OCR基础理论学习原创 2022-11-02 15:12:13 · 2839 阅读 · 0 评论 -
alueError: (‘Could not interpret optimizer identifier:‘, <keras.optimizers.Adam object at 0x0000023C
debug原创 2022-10-26 15:29:56 · 2178 阅读 · 1 评论 -
cv2.line()转
转转载 2022-10-21 10:13:52 · 205 阅读 · 0 评论 -
文本检测算法----DB、DBNet
表格文字识别转载 2022-06-06 16:03:13 · 254 阅读 · 0 评论 -
pip installl lap安装失败 error: Microsoft Visual C++ 14.0 or greater is required.
lap是使用Jonker-Volgenant算法求解稠密(LAPJV)或稀疏(LAPMOD)矩阵的线性分配问题求解器为了使用模块lap,结果pip install lap安装失败,命令行提示如下ERROR: Command errored out with exit status 1: command: 'D:\Anaconda3\envs\tensorflow\python.exe' -u -c 'import io, os, sys, setuptools, tokenize; sys.原创 2022-05-27 11:36:15 · 1832 阅读 · 2 评论 -
基于YOLOV5的DeepSort轨迹跟踪方法(一)
论文笔记:《基于YOLOv5和DeepSort的多目标跟踪算法研究与应用》-1YOLO系列基础知识作为一阶段经典算法,YOLO系列的算法由于省略了粗定位的过程,通过调整骨干网络可以实现速度比二阶段算法Faster-RCNN更快的性能。YOLO之前的检测算法都是基于分类器实现,例如滑动窗口在图片上滑动评估物体的存在。YOLO—次性计算包含边界框及每个边界框所属类别概率的输出,这个过程是一阶段、端到端实现的。本论文的研究内容主要基于YOLOv3和不同量级的YOLOv5展开。YOLO模型将原图分割成SxS原创 2022-05-26 10:53:35 · 2027 阅读 · 0 评论 -
DeepSort轨迹跟踪方法
由于SORT凭借交并比IOU进行识别判断的方式仅考虑了边界框之间的距离匹配而忽略了内容特征的匹配,易导致身份变换现象。DeepSort通过集成表观信息来降低ID-Switch发生频率。图2-8为DeepSort的流程图。从图中可以看出,DeepSort在Sort算法的基础上增加了级联匹配策略,同时考虑目标间距和特征相似度,并对新生成的跟踪轨迹采取验证机制以排除错误的预测结果。DeepSort的核心流程与Sort—致,沿用预测、观测、更新相结合的方式。DeepSort匹配过程分为几下几种情况:(1)卡尔.原创 2022-05-26 10:09:02 · 1042 阅读 · 0 评论 -
REID-轨迹跟踪任务中的ID一致性
要解决目标之间的重识别问题(Re-identification,RelD)。重识别是解决交叉摄像头图像匹配问题最直接的方法。目前RelD的研究和技术应用主要聚焦于行人重识别[28],用于在交叉视角下实现对指定行人的跨视域检索,属于图像检索的子任务,可用于无人超市、刑侦追缉、跟踪车辆等智能视频监控领域。在行人重识别领域,每个摄像机摄制的图像会形成一个包含各种目标在内的候选行人库,通常包含同一目标的多个视角图像。如图2-4所示,行人重识别通过输入指定的目标行人图像,在行人图像数据库中检索与输入图像具有相同特征.原创 2022-05-25 17:10:39 · 605 阅读 · 0 评论 -
目标检测(二)——先验框/锚框
先验框/锚框先验框(prior bounding box),锚框(anchor box)在不同的论文里叫法不一样,但是都是同一概念。锚框的作用锚框的作用,在进行目标检测任务的基本思路:通过设定众多的候选框,然后针对候选框进行分类和微调,找到目标中最接近的真实框,实现目标检测。这里的候选框也就是锚框。锚框的大小设定(多个不同大小)在任务中,为了尽可能地覆盖更多的面积和区域,需要设定多种不同尺度的先验框,为了后续与真实框(标注的框)尽可能接近。不同尺度也就是不同的长宽高比例的先验框。显然,原创 2022-05-23 14:03:51 · 2884 阅读 · 0 评论 -
PP-LCNet: 一个轻量级的卷积神经网络
一、PP-LCNet: 一个轻量级的卷积神经网络我们提出了一个基于MKLDNN加速策略的轻量级卷积神经网络,叫做PP-LCNet,他是一个能够用于多任务的轻量级模型。这篇论文提出了一些能在保持延迟不变的情况下提高模型准确率的方法。在这些优势的加持下,PP-LCNet与之前预测速度差不多的模型相比更加准确。对于计算机视觉的一些下流任务(指具体应用),比如目标检测、语义分割等,该模型效果也很好。我们的实验是基于PaddlePaddle实现的可以直接在飞桨查看相关的项目事例。二、模型提出的原因轻量级网络模型原创 2022-05-05 14:29:41 · 3219 阅读 · 0 评论 -
swish激活函数
激活函数提出论文:swichf(x)=x⋅sigmoid(βx)β是个常数或可训练的参数.Swish 具备无上界有下界、平滑、非单调的特性。Swish 在深层模型上的效果优于 ReLU。例如,仅仅使用 Swish 单元替换 ReLU 就能把 Mobile NASNetA 在 ImageNet 上的 top-1 分类准确率提高 0.9%,Inception-ResNet-v 的分类准确率提高 0.6%。导数:当β = 0时,Swish变为线性函数:f(x)=x2f(x)=x2.β → ∞,原创 2022-05-05 14:15:38 · 8238 阅读 · 0 评论