嵌入式视觉
双非本科,曾4个月考研上岸211硕士,现大厂算法开发工程师,从事视觉算法开发和模型压缩部署工作,终身学习践行者。想要了解更多干货和开源项目,欢迎关注我的公众号-嵌入式视觉。
展开
-
Halcon 快速入门
HALCON 是德国 MVtec 公司开发的一款综合性的机器视觉标准软件,拥有全球通用的集成开发环境(HDevelop)。它节约了产品成本,缩短了软件开发周期——HALCON 灵活的架构便于机器视觉,医学图像和图像分析应用的快速开发。在欧洲以及日本的工业界已经是公认具有最佳效能的机器视觉(Machine Vision)软件。原创 2022-10-25 16:04:28 · 2344 阅读 · 1 评论 -
一文入门 3D 视觉算法基础
SLAM 是Simultaneous Localization and Mapping的缩写,中文译作“同时定位与地图构建”。它是指搭载特定传感器(单目、双目、RGB-D相机、Lidar)的主体,在没有环境先验信息的情况下,在运动过程中建立环境的模型,同时估计自己的运动。如果这里的传感器主要为相机,那就称为“视觉SLAM”;如果传感器位激光,则为激光 SLAM。原创 2022-10-12 16:49:22 · 4232 阅读 · 6 评论 -
万字长文详解 YOLOv1-v5 系列模型
yolov1 作者提出了一种新的目标检测方法 YOLO,之前的目标检测工作都是重新利用分类器来执行检测。作者的神经网络模型是端到端的检测,一次运行即可同时得到所有目标的边界框和类别概率。YOLO 架构的速度是非常快的,base 版本实时帧率为 45 帧,smaller 版本能达到每秒 155 帧,性能由于 DPM 和 R-CNN 等检测方法。原创 2022-12-14 15:41:45 · 1295 阅读 · 7 评论 -
cv算法工程师学习成长路线
本文内容为 cv 算法工程师成长之路上的经典学习教材汇总,对于一些新兴领域则给出了较好的博客文章链接。本文列出的知识点目录是成系统且由浅至深的,可作为 cv 算法工程师的常备学习路线资料。部分学习资料存在离线 PDF 电子版,其可在 github仓库-cv_books 中下载。原创 2022-11-15 21:34:35 · 4087 阅读 · 44 评论 -
目标检测模型的基础
目标检测模型的基础知识包括 anchor box、iou、focal loss、nms算法等内容。原创 2022-09-08 21:15:03 · 512 阅读 · 0 评论 -
目标检测模型的评价标准-AP与mAP
为了了解模型的泛化能力,即判断模型的好坏,我们需要用某个指标来衡量,有了评价指标,就可以对比不同模型的优劣,并通过这个指标来进一步调参优化模型。对于分类和回归两类监督模型,分别有各自的评判标准,目标检测模型评价指标主要包含 f1、ap、map、roc计算公式及代码实现与auc曲线绘制等。原创 2022-09-08 21:19:43 · 1574 阅读 · 0 评论 -
GitHub 车牌检测识别项目调研
汽车车牌检测和识别实践指南,提供了算法方案和测试效果。原创 2022-11-09 19:41:26 · 939 阅读 · 3 评论 -
一阶段目标检测网络-RetinaNet详解
Retinanet 是作者 Tsung-Yi Lin 和 Kaiming He(四作) 于 2018 年发表的论文 Focal Loss for Dense Object Detection。作者深入分析了极度不平衡的正负(前景背景)样本比例导致 one-stage 检测器精度低于 two-stage 检测器,基于上述分析,提出了一种简单但是非常实用的 Focal Loss 焦点损失函数,并且 Loss 设计思想可以推广到其他领域。原创 2022-09-09 11:55:01 · 2453 阅读 · 0 评论 -
万字长文解析Scaled YOLOv4模型(YOLO变体模型)
Scaled YOLOv4 模型最主要的贡献在于通过理论系统分析和实验证了模型缩放的原则,进一步拓展了 CSPNet 方法,并基于此设计了一个全新的 Scaled-YOLOv4,Scaled-YOLOv4 网络的卷积模块都有使用 CSP。总的感觉就是针对不同的 GPU 平台,根据作者分析出来的模型缩放理论,且符合一些原则的情况下,选择不同的模型宽度和深度参数,并让模型更深更宽。原创 2022-10-25 16:44:31 · 1410 阅读 · 9 评论 -
二阶段目标检测网络-FPN 详解
FPN(feature pyramid networks) 是何凯明等作者提出的适用于多尺度目标检测算法。原来多数的 object detection 算法(比如 faster rcnn)都是只采用顶层特征做预测,但我们知道低层的特征语义信息比较少,但是目标位置准确;高层的特征语义信息比较丰富,但是目标位置比较粗略。另外虽然也有些算法采用多尺度特征融合的方式,但是一般是采用融合后的特征做预测,而本文不一样的地方在于预测是在不同特征层独立进行的。原创 2022-09-09 11:34:29 · 911 阅读 · 2 评论 -
二阶段目标检测网络-Faster RCNN 详解
backbone 为 vgg16 的 faster rcnn 网络结构如下图所示,可以清晰的看到该网络对于一副任意大小 PxQ 的图像,首先缩放至固定大小 MxN,然后将 MxN 图像送入网络。原创 2022-09-09 11:31:05 · 1127 阅读 · 2 评论 -
二阶段目标检测网络-Mask RCNN 详解
Mask RCNN 是作者 Kaiming He 于 2018 年发表的论文。Mask RCNN 继承自 Faster RCNN 主要有三个改进:1,feature map 的提取采用了 FPN 的多尺度特征网络2,ROI Pooling 改进为 ROI Align3,在 RPN 后面,增加了采用 FCN 结构的 mask 分割分支。原创 2022-09-09 11:40:09 · 355 阅读 · 0 评论 -
二阶段目标检测网络-Cascade RCNN 详解
Cascade RCNN 是作者 Zhaowei Cai 于 2018 年发表的论文 Cascade R-CNN: Delving into High Quality Object Detection。Cascade R-CNN 来解决 IoU 选择的问题。它由一系列不断增加 IoU 阈值的检测器组成,可以逐步的更接近目标的预测。原创 2022-09-09 11:48:22 · 525 阅读 · 0 评论 -
基于深度学习的语义分割技术总览
在计算机视觉领域,有一个方向是语义分割,一般是针对图像进行像素级分类,具体而言,就是语义图像分割会将每个像素都标注上其对应的类别。与实例分割(mask rcnn)不同,实例分割常常与目标检测系统相结合,用于检测和分割场景中同一对象的多个实例。原创 2020-02-20 09:44:09 · 1216 阅读 · 0 评论 -
神奇的人工智能之神笔马良|Stable Diffusion使用
1,月球上骑马的宇航员。image generate by stable-diffusion model2,下棋的狗image generate by stable-diffusion model3,沉迷学习的史努比image generate by stable-diffusion model4,鲤鱼跃出海面image generate by stable-diffusion model5,舞台...原创 2022-09-01 15:53:32 · 2892 阅读 · 0 评论