- 博客(474)
- 资源 (49)
- 收藏
- 关注
原创 CVPR2024 合成异常数据 工业异常检测 RealNet
本文分享一个基于扩散模型的异常检测框架,用于检测工业场景的缺陷检测或异常检测。强度可控扩散异常合成:基于扩散过程的合成策略,能够生成不同强度的异常样本,模仿真实异常样本的分布。异常感知特征选择:选择代表性和判别性的预训练特征子集,以提高异常检测性能并控制计算成本。重建残差选择:自适应选择判别性残差,用于全面识别各级异常区域。强度可控扩散异常合成,简称为SDAS,生成的异常图像,如下图所示。这些异常图像,都是基于正常图像生成的。
2024-05-31 23:08:56 2659
原创 3D工业视觉
本文主要介绍3D视觉技术、工业领域的应用、市场格局等。3D视觉技术满足工业领域更高精度、更高速度、更柔性化的需求,扩大工业自动化的场景。移动机器人视觉引导是一个前景的场景,主要技术包括结构光、ToF、立体视觉。从深度学习到通用视觉大模型,AI助力机器视觉提升效率,拓展应用场景。
2024-05-23 20:51:03 2404 3
原创 【6D位姿估计】SAM-6D 当分割一切遇到位姿估计 CVPR2024
本文介绍6D位姿估计的方法SAM-6D,来自CVPR 2024的论文。它是一个用于零样本6D位姿估计的框架,在测试新物体时,无需进行微调,直接进行检测。通过结合实例分割模型和姿态估计模型,实现对新物体的6D姿态估计。
2024-05-17 19:09:37 1911 4
原创 【6D位姿估计】FoundationPose 支持6D位姿估计和跟踪 CVPR 2024
本文介绍6D位姿估计的方法FoundationPose,是CVPR 2024的满分论文,支持6D位姿估计和跟踪。通过大规模的合成数据训练,具有强大的泛化能力,在测试新物体时,无需进行微调。支持输入一些物体的RGBD图片,模型进行3D物体构建;生成多个假设的姿态,进行评分和排序得到最精准的姿态。
2024-05-09 00:16:09 5009 3
原创 【多模态融合】MetaBEV 解决传感器故障 3D检测、BEV分割任务
本文介绍多模态融合中,如何解决传感器故障问题;基于激光雷达和相机,融合为BEV特征,实现3D检测和BEV分割,提高系统容错性和稳定性。会讲解论文整体思路、模型框架、论文核心点、损失函数、实验与测试效果等。
2024-04-06 19:42:09 1846
原创 【多模态融合】SuperFusion 激光雷达与相机多层次融合 远距离高清地图预测 ICRA 2024
本文介绍激光雷达与相机进行多层次融合,包括数据级融合、特征级融合和BEV级融合。融合后的BEV特征可以支持不同的任务头,包括语义分割、实例编码和方向预测,最后进行后处理生成高清地图预测,它是来自ICRA 2024的。会讲解论文整体思路、模型框架、论文核心点、损失函数、实验与测试效果等。
2024-03-26 01:45:35 3665
原创 【多模态融合】CRN 多视角相机与Radar融合 实现3D检测、目标跟踪、BEV分割 ICCV2023
本文介绍使用雷达与多视角相机融合,实现3D目标检测、3D目标跟踪、道路环境BEV分割,它是来自ICCV2023的。会讲解论文整体思路、输入数据分析、模型框架、设计理念、损失函数等。
2024-03-03 13:13:29 1924
原创 4D毫米波雷达——ADCNet 原始雷达数据 目标检测与可行驶区域分割
本文介绍使用4D毫米波雷达,基于原始雷达数据,实现目标检测与可行驶区域分割,它是来自2023-12的论文。ADCNet只使用雷达信息,实现车辆检测和可行驶区域分割。输入:原始雷达数据;即ADC数据,由4D毫米波雷达生成。信号处理模块:用一个可学习的信号处理层,来处理原始ADC数据。RD特征:信号处理层将ADC数据,转为RD特征,范围-多普勒信息,包含距离和速度信息。主干网络:进一步编码RD特征,隐式地估算目标的方位角。任务头:首先进行RAD张量预训练。在预训练完后,进行微调检测任务头和分割任务头
2024-01-30 00:24:41 2199
原创 4D毫米波雷达——FFT-RadNet 目标检测与可行驶区域分割 CVPR2022
本文介绍使用4D毫米波雷达,实现目标检测与可行驶区域分割,它是来自CVPR2022的。会讲解论文整体思路、输入数据分析、模型框架、设计理念、损失函数等,还有结合代码进行分析。输入是“范围-多普勒”信息,即RD图;由4D毫米波雷达生成。经过主干网络和FPN提取特征信息,并进一步编码形成“范围-角度”信息”。然后接两个任务头:车辆检测任务、可行驶区域分割任务。
2024-01-21 17:59:54 3276 2
原创 4D毫米波雷达——原理、对比、优势、行业现状
4D 毫米波雷达是传统毫米波雷达的升级版,4D指的是速度、距离、水平角度、垂直高度四个维度。相比传统 3D 毫米波雷达,4D 毫米波雷达增加了“高度”的探测,将第四个维度整合到传统毫米波雷达中。4D毫米波雷达被视为未来车载雷达的一种可能的标准配置,因为它在多方面优于传统的毫米波雷达和低线激光雷达,能与高线激光雷达互补。预计这种雷达将被广泛应用于各种车型中。与传统雷达产品相比,4D毫米波雷达能够突破在静止目标识别横向移动检测高度识别区分邻近物体和探测隐藏车辆等方面的限制。
2024-01-18 00:02:47 9168
原创 【占用网络】SurroundOcc:基于环视相机实现3D语义占用预测 ICCV 2023
本文分享“占用网络”方案中,来自ICCV 2023的SurroundOcc,它基于环视相机实现3D语义占用预测。使用空间交叉注意力将多相机图像信息提升到3D体素特征,即3D体素Query到2D图像中查询融合特征的思想。然后使用3D卷积逐步对体素特征进行上采样,并在多个层次特征图上进行损失监督。同时,SurroundOcc介绍了如何通过多帧点云,构建稠密的3D语义占用栅格数据集,这部分也是挺重要的。清华大学云盘。
2024-01-10 23:57:01 1409
原创 【占用网络】VoxFormer 基于视觉的3D语义场景方案 CVPR 2023
本文分享“占用网络”方案中,来自CVPR2023的VoxFormer,它基于视觉实现3D语义场景补全。使用Deformable Attention从图像数据中,预测三维空间中的体素占用情况和类别信息。VoxFromer是一个两阶段的框架第一个阶段:预测每个像素的深度值,将像素投影三维空间中,2D图像到3D空间的思想。然后预测每个三维网格是否被占用,生成稀疏体素特征。最后选择其中是“占用”的体素作为“体素查询特征”进入第二阶段。这个阶段只预测占用情况,选择一些值得分析的体素。第二个阶段。
2024-01-04 00:43:57 1907
原创 【占用网络】OccNet: Scene as Occupancy 适用于检测、分割和规划任务 ICCV2023
本文分享“占用网络”方案中,具有代表性的方法:OccNet。它以多视角视觉为核心,首先生成BEV特征,然后通过级联结构和时间体素解码器重建生成3D占用特征。构建一个通用的“3D占用编码特征”,用以表示3D物理世界。这样的特征描述可以应用于广泛的自动驾驶任务,包括检测、分割和规划。
2023-12-29 00:44:48 2212
原创 【BEV感知】BEVFormer 融合多视角图形的空间特征和时序特征 ECCV 2022
本文分享BEV感知方案中,具有代表性的方法:BEVFormer。基本思想:使用可学习的查询Queries表示BEV特征查找图像中的空间特征和先前BEV地图中的时间特征。它基于Deformable Attention实现了一种融合多视角相机空间特征和时序特征的端到端框架,适用于多种自动驾驶感知任务。主要由3个关键模块组成:BEV Queries Q:用于查询得到BEV特征图Spatial Cross-Attention:用于融合多视角空间特征。
2023-12-17 23:12:08 3478 1
原创 单目3D目标检测 方法综述——直接回归方法、基于深度信息方法、基于点云信息方法
本文综合整理单目3D目标检测的方法模型,包括:基于几何约束的直接回归方法,基于深度信息的方法,基于点云信息的方法。万字长文,慢慢阅读~ 直接回归方法涉及到模型包括:MonoCon、MonoDLE、MonoFlex、CUPNet、SMOKE等。基于深度信息的方法涉及到模型包括:MF3D、MonoGRNet、D4LCN、MonoPSR等。基于点云信息的方法涉及到模型包括:Pseudolidar、DD3D、CaDDN、MonoDTR等。
2023-10-26 00:26:07 4038 2
原创 手把手搭建一个【卷积神经网络】
前言本文介绍卷积神经网络的入门案例,图像分类;使用到CIFAR10数据集,它包含10 类,即:“飞机”,“汽车”,“鸟”,“猫”,“鹿”, “狗”,“青蛙”,“马”,“船”,“卡车” ;共 60000 张彩色图片;通过搭建和训练卷积神经网络模型,对图像进行分类,能识别出图像是“汽车”,或“鸟”,还是其它。思路流程导入 CIFAR10 数据集 探索集数据,并进行数据预处理 建立模型(搭建神经网络结构、编译模型) 训练模型(把数据输入模型、评估准确性、作出预测、验证预测) 使用训练..
2021-05-05 17:12:20 16255 27
原创 【神经网络】综合篇——人工神经网络、卷积神经网络、循环神经网络、生成对抗网络
前言本文综合整理常用的神经网络,包括生物神经网络、人工神经网络、卷积神经网络、循环神经网络、生成对抗网络;参考了许多高校的课程、论文、博客和视频等。文章的结构是先进行概念了解,然后结合图片、结构图、一步一步详细讲解;大家要不看看?( •̀ ω •́ )y一、人工神经网络简介:人工神经网络(Artificial Neural Network, ANN),由人工神经元构成的网络,模拟人类的大脑;它模拟生物过程以反映人脑某些特征的计算结构。联系:人工神经元模拟生物神经元;人工神经网络模拟...
2021-04-17 17:03:06 38608 19
原创 一篇文章认识《双目立体视觉》
双目立体视觉,由两个摄像头组成,像人的眼睛能看到三维的物体,具有深度的信息;单目视觉只能看到二维的物体。1)双目摄像头2)双目相机基线3)打开双目摄像头4)双目测距视差disparity、极线约束、极线校正/立体校正、a.双目标定b.双目矫正c.立体匹配d.双目测距(三角测量)e.测距效果立体视觉方法评测网站
2021-04-02 01:28:17 6675 25
原创 目标检测模型NanoDet(超轻量,速度很快)介绍和PyTorch版本实践
YOLO、SSD、Fast R-CNN等模型在目标检测方面速度较快和精度较高,但是这些模型比较大,不太适合移植到移动端或嵌入式设备;轻量级模型 NanoDet-m,对单阶段检测模型三大模块(Head、Neck、Backbone)进行轻量化,目标加检测速度很快;模型文件大小仅几兆(小于4M)。该代码基于NanoDet项目进行小裁剪,专门用来实现Python语言、PyTorch 版本的代码,下载直接能使用,支持图片、视频文件、摄像头实时目标检测。
2020-12-02 23:25:20 32721 65
原创 基于神经网络——鸢尾花识别(Iris)
前言鸢尾花识别是学习AI入门的案例,这里和大家分享下使用Tensorflow 2框架,编写程序,获取鸢尾花数据,搭建神经网络,最后训练和识别鸢尾花。流程:1)获取鸢尾花数据,分析处理。2)整理数据位训练集,测试集。3)搭建神经网络模型。4)训练网络,优化网络模型参数。5)保存最优的模型,进行识别...
2020-07-05 19:30:03 31918 17
原创 如何使用 ONNX 结合 GPU 加速推理(CUDA 与 cuDNN 简明指南)
在深度学习模型推理中,使用 GPU 进行加速是提升模型推理速度的关键方式之一。本文将带大家一步步了解如何使用 ONNX Runtime 结合 NVIDIA 的 CUDA 和 cuDNN 进行 GPU 加速。
2024-09-10 23:02:48 467
原创 PyInstaller问题解决 onnxruntime-gpu 使用GPU和CUDA加速模型推理
在模型推理时,需要使用GPU加速,相关的CUDA和CUDNN安装好后,通过onnxruntime-gpu实现。直接运行python程序是正常使用GPU的,如果使用PyInstaller将.py文件打包为.exe,发现只能使用CPU推理了。本文分析这个问题和提供解决方案,供大家参考。
2024-09-07 23:30:36 442
原创 Python 应用程序 | 打包为| .exe可执行文件
PyInstaller 是一个用于将 Python 应用程序打包为独立可执行文件的工具。它将 Python 脚本以及脚本所依赖的所有库和模块打包成一个文件夹或单个可执行文件,使得最终用户无需安装 Python 环境即可运行应用程序。跨平台支持: PyInstaller 支持 Windows、macOS 和 Linux 等主流操作系统,可以生成适用于这些平台的可执行文件。自动分析依赖项: PyInstaller 会自动分析你的 Python 脚本并识别出所有依赖项,包括标准库、第三方库和数据文件。
2024-08-18 20:37:52 1001
原创 PCL从理解到应用【10】 三维点云 | 表面重建 | 泊松Poisson
在PCL中,用于处理点云表面的主要方法包括:泊松表面重建、贪心投影三角化、Alpha Shapes等。本文介绍泊松表面重建,包括原理分析,思路流程,两个实践应用和代码。点云是三维空间中的一组离散点,这些点没有连接信息,因此需要重建一个连续的表面。泊松表面重建方法基于泊松方程,通过对点云中的法线进行全局最优化来生成表面。它将表面重建问题转化为求解泊松方程的过程,结果是一个光滑的表面。
2024-08-07 20:33:52 1348
原创 PCL从理解到应用【09】 点云特征 | 关键点提取 | 方法汇总
在PCL中,有多种方法和函数可以用来提取点云特征,本文介绍关键点提取。提取点云关键点,本文介绍的方法包括:SIFT、Harris、NARF、ISS和SUSAN。Harris 提取点云关键点,效果如下图所示:白色点是原始的点云(兔子),绿色点是Harris提取的点云关键点。对比一下5种点云关键点算法,如下表格所示:方法简介特点时间复杂度优点缺点SIFT基于尺度不变特征变换,检测不同尺度和旋转不变的关键点尺度不变性、旋转不变性高在尺度和旋转变化下稳定,对噪声有较强的鲁棒性。
2024-08-03 15:28:24 1362
原创 PCL从理解到应用【08】 点云特征 | 法线估计 | 主曲率估计
在PCL中,有多种方法和函数可以用来提取点云特征,本文介绍几何特征。其中,几何特征主要包括法线估计和主曲率估计。这些特征能够描述点云表面的几何形状,常用于进一步的点云处理和分析,如配准、分割和物体识别。平面的法向量估计,示例效果:1. 法向量 (Normal Vector)法向量是一个垂直于曲面或平面的向量,描述了曲面在某一点的局部方向。对于一个三维曲面,法向量是法平面的法线。对于每个点,定义一个局部邻域。在这个邻域中,使用算法拟合一个平面。法向量是拟合平面的法线方向。
2024-08-02 21:21:19 1089
原创 YOLO格式转Labelme | 标签信息 | 辅助标注 | txt转json
本文分享将常规的YOLO检测信息,转为Labelme中的标签信息。即:xxx.txt 转 xxx.json。YOLO版本支持YOLOv8、YOLOv5等。通过模型预测的信息,有了大致的检测位置和类别信息,人工进行微调和审核即可,实现辅助标注。
2024-08-01 22:35:26 999
原创 PCL从理解到应用【07】点云滤波 原理分析 | 案例分析 | 代码实现
本文分析点云滤波算法的原理,集合案例深入理解,同时提供源代码。包括:体素栅格滤波、统计滤波、条件移除滤波、半径滤波、下采样滤波等。
2024-07-28 00:51:56 996
原创 PCL从理解到应用【06】 RANSAC原理分析 | 案例分析 | 代码实现
本文分析RANSAC算法的原理,集合案例深入理解,同时提供源代码。RANSAC,随机采样一致性,是一种迭代的算法,用于从一组包含异常值的数据中估计模型参数。示例案例:平面拟合、线段拟合、球体拟合等。
2024-07-16 22:31:07 672
原创 PCL从理解到应用【05】快速安装PCL环境 | PCL测试| Linux系统
本文介绍在Ubuntu系统中,通过apt-get方式安装,快速安装PCL。安装好后,通过编写C++代码,直接调用的pcl库。
2024-07-14 12:24:21 1123
原创 PCL从理解到应用【04】Octree 原理分析 | 案例分析 | 代码实现
Octree 作为一种高效的空间分割数据结构,具有重要的应用价值。本文将深入分析 Octree 的原理,通过多个实际案例帮助读者全面理解其功能和应用,包括最近邻搜索、半径搜索、盒子搜索以及点云压缩(体素化)。特性近邻搜索半径搜索盒子搜索点云压缩(体素化)描述查找距离给定点最近的一个或多个点查找给定点一定半径范围内的所有点查找给定空间盒子内的所有点将点云数据划分为均匀大小的立方体(体素)输入参数目标点,近邻数量目标点,半径盒子的最小点和最大点分辨率输出最近的一个或多个点的索引及距离。
2024-07-12 21:01:20 1140
原创 PCL从理解到应用【03】KDTree 原理分析 | 案例分析 | 代码实现
本文分析KDTree的原理,集合案例深入理解,同时提供源代码。三个案例:K近邻搜索、半径内近邻搜索、近似最近邻搜索。
2024-07-05 22:00:03 1085
原创 PCL从理解到应用【02】PCL环境安装 | PCL测试| Linux系统
本文介绍在Ubuntu18.04系统中,如何安装PCL。源码安装方式:pcl版本1.91,vtk版本8.2.0,Ubuntu版本18.04。安装好后,可以看到pcl的库,在/usr/lib/中。
2024-07-04 20:41:25 1164
原创 点云可视化 .ply文件 | 方案汇总
本文分析可视化点云.ply文件的几种方法,包括MeshLab软件、在线可视化点云.ply文件、通过PyntCloud库编程实现。PLY是一种用于存储三维数据的文件格式,常用于点云数据和多边形网格。被广泛应用于计算机图形学、3D扫描和3D打印等领域。PLY文件可以存储顶点、面以及相关属性(如颜色、法线等)。
2024-06-27 20:18:36 2293
原创 Stable Diffusion 3 文本生成图像 在线体验 原理分析
本文分享使用Stable Diffusion 3实现文本生成图像,可以通过在线网页中免费使用的,也有API等方式访问。Stable Diffusion 3是Stability AI开发的最新、最先进的文本生成图像模型,在图像保真度、多主体处理和文本匹配方面取得了显著进步。利用新的多模态扩散变换器(MMDiT)架构,它具有单独的图像和语言表示的Stable Diffusion 3权重。
2024-06-22 11:09:18 1273
原创 labelme转YOLOv8、YOLOv5 标签格式 标注数据
本文分析将labelme的标签,转为YOLOv8、YOLOv5的格式,实现模型训练。首先了解YOLOv8和YOLOv5标签格式,然后了解labelme标签格式,最近实现数据格式转换。
2024-06-11 18:50:11 2138 3
原创 文档翻译 在线 免费(一译)
有时需要看英文论文,奈何英语水平不太好,看完10几页的文档很吃力;于是到网上找了一大堆方法,一个一个尝试,找到在线免费的文档翻译;这里分享一下。它的名称为:一译。特点是在线、免费、支持上传arXiv在线论文。
2024-05-30 17:45:42 476
原创 AAAI2024 基于扩散模型 多类别 工业异常检测 DiAD
本文分享一个基于扩散模型的多类别异常检测框架,用于检测工业场景的缺陷检测或异常检测。设计SG语义引导网络,在重建过程中有效保持输入图像的语义信息,解决了LDM在多类别异常检测中的语义信息丢失问题。高效重建,通过在潜在空间中进行扩散和去噪操作,增强了模型在处理复杂结构和大规模缺陷时的重建能力。同时分析基础扩散模型DDPM和LDM,对比设计原理和效果。
2024-05-28 22:05:28 2220 2
原创 引脚 针脚 pin针歪斜检测——工业设备调研
本文汇总引脚歪斜检测、针脚歪斜检测、pin针歪斜检测的工业设备示例,供大家参考。目录前言方案1:机器视觉的端子PIN针歪斜检测系统方案方案2:芯片引脚歪斜检测方案3:pin针3D检测 歪斜方案4:芯片引脚歪斜检测(高分辨率彩色相机CCD)
2024-05-18 22:09:51 636
原创 引脚 针脚 pin针歪斜检测——技术方案 论文研读
本文汇总引脚歪斜检测、针脚歪斜检测、pin针歪斜检测的技术方案,供大家参考。主要介绍两个示例,基于传统图像算法和机器学习的PIN针歪斜检测。目录前言方案1:基于传统图像算法的PIN针歪斜检测方案2:基于机器学习的连接器缩针弯针检测系统研究。
2024-05-18 09:30:08 1299
CVPR 2022 Tutorial Denoising Diffusion-based Generative Model
2023-11-11
整理近年来《人工智能》的标准和评估规范
2020-11-19
宝马:深度学习在自动驾驶中的应用及部署过程.pdf
2020-04-05
“2019年中国自动驾驶行业发展研究报告-前瞻产业研究院-2019.8”.pdf
2020-04-05
VScode+opencv3.4+mingw5.3+cmake-3.9.0.rar
2020-04-03
apollo_demo_2.0.bag数据包
2020-01-13
apollo__demo_1.5.bag数据包
2020-01-13
apollo--demo_1.0数据包
2020-01-13
decawave_trek1000_arm2.10_pc3.6.zip
2019-07-22
ZigBee各类传感器模块-例程及使用手册说明.zip
2019-07-19
bazel-0.27.1-installer-linux-x86_64.sh
2019-07-10
Win32DiskImager-0.9.5-install 树莓派和电脑传输文件
2019-02-25
全国大学生电子设计竞赛 培训资料
2018-10-21
CC2530 (zigbee) 中文数据手册完全版
2018-10-05
cc2530蓝牙 PWM 小车
2018-01-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人