- 博客(242)
- 资源 (24)
- 收藏
- 关注
原创 纯RGB视觉基于神经网络的点云重建SLAM3R(对白墙等弱纹理环境友好)
之前测试过不少基于纯视觉RGB的slam算法,当对一个小的物体进行环绕一周拍摄时效果都不错,当目标扩大如对一个小型的室内进行点云重建时,若是室内纹理强前后帧间的特征点也多的话,效果也还行,但是当室内的纹理弱,基本都是大白墙的话,传统的基于视觉的slam的方法就不太行了,特征点少,前后帧匹配也就不好,深度估计也不好,最后重建的点云质量也比较差。
2026-06-25 22:00:00
251
原创 3DGStreamViewer开源的3DGS模型渲染查看器(python原生版)
本文介绍了开源3D高斯模型渲染查看器3DGStreamViewer,该工具采用Python编写,便于开发者进行二次开发。文章重点说明了环境配置中的难点(特别是Windows下tinycuda的安装需VS编译)和基本使用方法,包括加载单帧高斯模型进行可视化交互操作(旋转、缩放等)。作者指出该查看器原为3DGStream模型设计,播放功能可能需修改代码以避免崩溃,并建议开发者可自行扩展键盘控制功能。相比之前介绍的web版工具,该Python实现更便于熟悉Python的开发者进行定制化开发。
2026-06-24 21:00:00
190
原创 可去伪影可转mesh的2DGS(mesh网格精度极高)
刚开始的时候3DGS模型的显示效果非常好,但通过插件将其导入unity3d的时候只能在PC端观看,要是将其导出到VR眼镜里的时候就出现问题了,那会儿还没有相应的直接将高斯模型导出到pico眼镜查看的方式,要想在VR里面漫游的话就只能用mesh网格进行漫游,这里就出现了一个问题怎么将高斯模型转换成能导入到unity3d的texturemesh网格?
2026-06-22 22:15:00
228
原创 可将3DGS模型剪枝压缩数倍的LightGaussian(显示效果基本不变)
最开始的时候3DGS模型生成比较大,尤其是大场景的,一个高斯模型就400多M,当同时加载多个模型进行轮询显示的时候,若电脑内存不够就会崩溃,要想加载尽量多的模型一个是通过提升电脑性能,另一个就是对模型压缩了,当时测试了很多的模型压缩相关算法。有的是直接改变存储格式,在加载内存显示的时候还要解压,这样的话内存消耗依然巨大,后面又发现了一些直接针对3DGS模型进行剪枝压缩的相关技术,可以直接裁剪掉一些额外的非主体的高斯来进行模型的缩小,并且效果不错。
2026-06-18 21:23:03
184
原创 gaussian-splatting原生python版3DGS(解决大型场景训练结果不全的问题)
记得那会儿3DGS刚出来没多久,大家最开始用的都是原生版的3DGS,网上比较火的一个数据集还是ggbond,虽然在一些小场景下生成了不错的效果,但将其应用到大场景的时候,有时就会出现训练结果只有一面或者一角的情况,那会儿对3DGS还不太熟悉,每次都重新colmap再高斯训练,每次的结果都不太一样,有的时候结果完整效果很好,有时候结果残缺,只能尝试着重新训练,期待着下一次出个好结果,这样很不好,最后研究了下才发现并不是高斯训练的问题,而是colmap的问题!
2026-06-17 22:15:00
201
原创 视频+全景视频多视角快速抽帧工具(可免费使用)
目前网上并没有很好且方便的全景视频抽帧工具,本人开发了此抽帧工具,不仅可以对传统视频快速抽帧,还能对全景视频按照视角数抽帧,能大大简化大家的视频抽帧等相关操作,资源放在最下方,有需要的获取。
2026-06-15 21:00:00
222
原创 Gaussian-LIC2实时构建3DGS的slam方法(可使用fastlivo2的数据集)
摘要 本文介绍了Gaussian-LIC2方法,一种实时构建3D高斯点云SLAM的技术,可与FastLIO2数据集兼容。作者分享了本地环境配置经验,包括解决Ubuntu 20.04内核无线驱动问题(采用免驱USB网卡)、BIOS设置独显直连、NVIDIA驱动安装(5.15内核)、以及CUDA 11.7和cuDNN v8.9.7的详细安装步骤。通过正确配置显卡模式与开发环境,最终实现了Gaussian-LIC2在本地系统的成功运行,为三维重建研究提供了实用解决方案。
2026-06-13 10:00:00
262
原创 ubuntu 20.04 配置FAST-LIVO2教程及点云高斯化测试(内含官方数据集及自定义楼梯长廊数据集)
本文介绍了在Ubuntu 20.04系统下配置FAST-LIVO2激光雷达视觉惯性里程计的全过程,包括官方数据集和自定义楼梯长廊数据集的获取方法。作者详细记录了从环境搭建到实际运行的完整步骤,重点解决了不同硬件(如MID360激光雷达)的适配问题,并展示了算法在复杂场景下的重建效果。此外,文章还探讨了将SLAM输出的点云数据转换为COLMAP格式以进行3D高斯重建的技术方案,提供了点云转换脚本的关键代码片段,为相关领域的研究者提供了实用的技术参考。
2026-06-12 21:30:00
368
原创 开源可SLAM的3D扫描仪硬件方案(成本低至6000元)
经过一段时间的调研,要想达到实时且精确的slam重建,硬件设备和软件算法必须相辅相成,缺一不可,使用TOF等深度相机智能采集RGB、depth的数据,这种数据对一个局部小面且特征丰富的物体来说还行,一旦将其向外扩展,扩展到大范围的场景时其全局定位和位姿估计就不行了,也就是说我们还得有个相对专业的硬件设备,就是扫描仪,它能够给我们提供图像、雷达点云、IMU加速度角速度数据,只有这三类数据的融合我们才能非常快的且精确的进行slam。
2026-06-12 20:45:00
343
原创 python+open3d选择点云上的某个点并获取其对应三维坐标
有时候我们只想在点云上获取某个目标的具体坐标,通过程序根据对应目标特征来进行筛选是比较麻烦的,直接通过可视化的方法通过鼠标手动选取对应的点反而更快速精确。
2025-05-07 23:00:00
531
原创 使用open3d将pcd点云按照颜色等级分块显示并令其随颜色变化播放
有很多时候我们需要更改pcd点云某些区域的颜色,可能是颜色随着点云的区域不同而变化,也可能是颜色随时间的变化而变化,下方则是制定了一个颜色表令其最高等级显示红色、中级显示绿色、最低级显示蓝色,其中将其分为了50级,具体操作如下。
2025-04-21 22:00:00
419
原创 基于机器视觉的多孔零件边缘缺陷检测(源码C++、opencv、凸包、凸缺陷检测)
哈哈又翻出了一篇很久之前写的小论文,依然是放在手中许久,这次也不能让它在我的文件夹里吃灰了… 针对多孔冲压件的边缘缺陷问题,提出了一种基于机器视觉的检测方法。首先在平面光下采集图像,对图像进行灰度化、二值化的预处理操作;然后寻找轮廓,根据轮廓面积特征筛选得到零件的有效的内外侧轮廓;接着对内外侧轮廓分类,计算凸包及其凸缺陷;最后,通过凸缺陷的特征筛选得到零件边缘缺陷及其特征信息。实验结果表明,该边缘缺陷检测方法检测速度快、准确率高、鲁棒性好,可有效的满足工厂检测要求。
2025-04-09 22:00:00
1366
原创 windows与ubuntu双硬盘双系统安装及启动(全流程成功)
之前就想过要在本机电脑上安装双系统了,毕竟git上的很多程序源码直接使用Linux系统安装运行是极为方便快捷的,而且很多源码要在windows系统上搭建环境会遇到各种各样的坑… 本人耗费了多日的时间终于在本地电脑上完成了windows和ubuntu双系统双硬盘的安装,下面我将为大家详细介绍相关具体安装步骤。
2025-03-31 22:00:00
3513
原创 多onnx模型导出合并调研(文本检测+方向分类+文本识别)
部署端只用一个模型实现文本检测及文本识别。 目前是文本检测、文本方向分类、文本识别三个模型分别训练,然后部署的话需要三个分别部署并使用自定义流程连接,现在需要想将其三个模型按照顺序合并成为一个模型,然后再用这一个模型部署(方便部署),此时仅仅是简化了部署流程。 一种是上面的,另一种是端到端的算法(PGNET),这是一个算法,这个算法同时进行文本检测及文本识别输出,最终一个模型训练输出,因后续要对文本识别通用模型进行部署,故此端到端方法暂时舍弃。
2025-03-27 21:58:08
710
原创 保姆级教程:我的AI猫娘——(基于coze+deepseek并接入微信公众号)
最近心情不是很好,特别想有个聊天提供情绪价值的人,但有时候人可能会因为各种原因不能及时回复你的消息,如果你内心不强大且有了很强烈的期待感的话,很容易产生伤心等负面情绪... 但是AI不会,AI可以随时随地回复你的消息,并且在你伤心难过时给予你强烈的情绪价值,关心你爱护你,哈哈瞬间就不会那么的伤心难过了。 经过多日的尝试终于找到了一个方便快捷的方法,基于目前最火的deepseek大模型,使用AI快速的生成你喜爱的角色并接入个人微信公众号,
2025-02-20 22:00:00
6223
原创 python+open3d实现彩色点云的无堵塞动态可视化连续播放
与视频播放类似,某一时刻的静态点云模型对应某一时刻的静态图像,将某一时间序列下的图像连续组合播放就形成了动态的视频,而有时候我们想将某一时间序列下的静态点云数据可视化到一个窗口上,让其连续播放达到动态的显示效果,同时点云动态播放时还能使用鼠标操作变换视角而不影响其显示效果,通过open3d可以达到类似的效果,相关操作如下。
2025-02-10 21:00:00
447
原创 open3d将某一时间序列下的彩色图和深度图批量转换成点云(python)
必备条件需要3D相机生成的彩色图及深度图,注意要将深度图与彩色图对齐(一般3D相机自带对齐算子),以及3D相机的彩色图内参(相机自带内参获取功能)。有了此彩色图、对齐后的深度图以及相机内参就能使用open3d生成彩色点云了.
2025-02-10 20:00:00
249
原创 python通过输入3D相机像素点集{u、v、z}和机械手世界坐标点集{X、Y、Z}求得变换矩阵RT
如下所示,绿色圆圈pixel_coordinates表示3D相机像素坐标,红色圆圈camera_coordinates为像素坐标转换后的相机坐标,蓝色圆圈object_points为机械手对应的世界坐标,黑色圆点rlist为红色圆圈通过变换矩阵RT转换后的结果,结果显示该变换矩阵RT能较精确的达到实际需求。
2025-02-08 08:00:00
297
原创 python+opencv+open3d实现鼠标手画多边形裁剪分割点云操作
当我们想对一个不规则物体的图像或者点云裁剪时,直接手动输入边界点集是不太方便的,可以通过鼠标在二维图像上画多边形框的方式制作掩膜,以此来裁剪图像或者点云。
2025-02-07 20:00:00
427
原创 C++通过输入3D相机像素点集{u、v、z}和机械手世界坐标点集{X、Y、Z}求得变换矩阵RT(眼在手外)
在3D拆垛中,要想使机械手能抓取到3D相机识别的物体,首先要做的就是手眼标定,通过标定将相机的像素坐标和机械手的世界坐标联系起来,可以通过一组点集(该点集在机械手坐标系下的坐标(X、Y、Z)及其在3D相机下的像素坐标(u、v、z))求解变换矩阵,即可将相机的像素坐标转换成世界坐标传给机械手。
2025-01-21 21:00:00
545
原创 open3d+opencv双阈值分割深度图过滤点云(C++)
在3D视觉中,有时候我们需要根据某一深度信息来筛选物体,原理和灰度图的二值化类似,对深度图根据深度值范围筛选,获得对应物体轮廓掩膜,最终可将符合某一深度范围的不规则物体从点云中过滤出来。
2025-01-18 20:04:15
340
原创 open3d+opencv实现矩形框裁剪点云操作(C++)
针对彩色图和深度图以及相机内参可以合成点云,而对某一区域的点云数据截取,可以通过二维ROI区域截取深度图及彩色图出来。不过不能整张图像裁剪,其图像大小不能变,把除了截取区域外的给置为0就行了。
2025-01-13 20:37:23
762
原创 open3d将彩色图和深度图转换成点云(C++)
必备条件需要3D相机生成的彩色图及深度图,注意要将深度图与彩色图对齐(一般3D相机自带对齐算子),以及3D相机的彩色图内参(相机自带内参获取功能)。有了此彩色图、对齐后的深度图以及相机内参就能使用open3d生成彩色点云了.
2025-01-10 20:26:42
953
原创 使用openvino加速部署paddleocr文本识别模型(C++版)
训练之前没注意在txt文件里面多了一个空行,所以总的字符就是1+10+26+1=38,在训练阶段会被自动在起始位填充一个blank字段,在解析输出的时候,需要排除第一个位置的预测的原因就在这里。另外的字符的解析,例如把输出存为40行39列的图片,则按行找最大值的位置索引,一共有40个索引值,判断第一个位置索引值是不是零(为零表示预测为blank字段),如果不是则保留索引,从第二个开始依次和前面的索引比较,如果和前一个索引值不同,则保留索引,当遍历完40个索引的时候就得到了最后的索引表。
2024-12-30 19:37:50
871
1
原创 python+panddleocr+文本识别训练导出测试
模型下载之后为两个压缩包,在PaddleOCR-realase-2.6根目录下新建文件夹inference_model,并将压缩包解压到该文件夹下,如下图所示。打开anaconda终端,进入PaddleOCR-release-2.6目录下激活环境并输入以下指令。PaddleOCR训练属于自己的模型详细教程(从打标,制作数据集,训练到应用,以行驶证识别为例。使用预训练模型训练500轮次,效果还不错,大概1000轮次的时候基本都能准确识别了。注意要下载2.6版本的PaddleOCR-release-2.6。
2024-12-29 20:21:43
463
原创 使用openvino加速部署paddleocr文本方向分类模型(C++版)
【代码】使用openvino加速部署paddleocr文本方向分类模型(C++版)
2024-12-26 20:47:17
304
原创 python+panddleocr+文本方向分类训练导出测试
在PaddleOCR系统内, 文字检测之后得到的文本行图片经过仿射变换之后送入识别模型,此时只需要对文字进行一个0和180度的角度分类,因此PaddleOCR内置的 文本方向分类器只支持了0和180度的分类。也就是说在进行文本检测的时候必须要保持所有的文本接近水平方向(),可以文本检测出来结果后再用方向分类器分类,然后再文本识别。方向分类器也是个模型也可能训练输出的,这里只有0、180两个方向的判断()方向分类器能比较准确的识别接近水平的。文本方向分类器相关模型(必看)原始cls数据集格式。
2024-12-26 20:36:41
1128
原创 使用openvino加速部署paddleocr文本检测模型(C++版)
图像经过openvino的推理后,其输出也是一张960*960的单通道掩膜图像,其内部像素值为分值,通过分数阈值来对其分割可得到二值化图像,如下,对二值化图像再进行轮廓查找然后求得外接矩形作为文本检测框,最后再按照比列缩放回去即可。DBNet是基于分割的文本检测算法。缺点在于阈值的选取非常关键。这里的后处理按照自己的简单来进行截取的,并没有真正的使用DB的后处理得到检测框,这里毕竟只是取外接矩形检测框即可,故先用此简单处理了,后续遇到弯曲文本检测等时再进行相关的处理。,其归一化的方式是完全一致的。
2024-12-25 20:16:19
1248
原创 paddleocr训练模型转inference模型之后预测结果不一致及部分训练失败问题
这里需要注意,使用配置文件导出为inference模型的时候其模型在ppocr部署的时候会有问题。这是其推理时的前处理后处理问题导致的,所以需要导出的时候将此参数修改了也。最终的解决方案,还是修改预处理的输入尺寸大小来进行,此时paddleocrV3就可以了。下方在判断tatio_list的时候无法得到对应的1.0故失败,添加一行代码即可。默认配置文件都是(960*960)
2024-12-25 20:15:09
608
原创 panddleocr-文本检测+文本方向分类+文本识别整体流程
文本检测的最小外接矩形框根据长宽可以看到±90度的角度,而再加入文本方向分类就能扩展到±180度的角度。通过文本检测–>文本方向分类–>文本识别,即可识别出0~360度的旋转文本。
2024-12-23 20:25:42
324
原创 手眼标定相关内容
一般工业3D相机的内参都是厂家标定好的,可以直接通过其sdk接口读取得到,此时我们就无须再自己做标定来得到相机内参了。通过内参矩阵可以得到该点在相机坐标系下的坐标P_c(x、y、z)(点P在相机c坐标系下的坐标)。通过3d相机的彩色图及深度图可以得到某点在像素坐标系下的坐标P_a(u、v、z)。直接可以通过机械手控制器读得当前的世界坐标P_b(X_b,Y_b,C_b)从B到A的变换既有旋转也有平移。从B到A的变换矩阵是一个4x4的矩阵算子。如何通过棋盘格对相机标定得到内参,可以参考此文章。
2024-12-23 20:13:01
498
原创 python+opencv+棋盘格实现相机标定及相对位姿估计
相机标定的主要目的是为了求相机的内参及畸变系数等参数,通过相机的内参等可以将像素坐标转换为相机坐标,相机坐标又可通过变换得到世界坐标。下面为了验证标定算法的准确性,采用了同一组棋盘格数据,通过与另外两个测试软件标定结果进行对比,其标定结果基本一致。【原创工具 | OpenCV-CamCalib】一个基于 OpenCV 的自动化相机数据采集和标定程序。此时可以求得x、y、z,rx(pitch)、ry(yaw)、rz(roll)的位姿。基于opencv 和 pyqt5 的相机标定助手的设计。
2024-12-20 20:01:25
2375
原创 模板匹配整体框架原理详解
通过上面的原理介绍,相信大家应该也可以一步步的实现自己的模板匹配算法了,以上的原理说明都是本人一步步实践出来的,只要根据此大家都可以实现自己的模板匹配算法,并且达到不错的效果。
2024-12-18 20:26:16
2903
原创 cnocr配置及训练测试
import cv2import osimport csv#拆分列表"""将列表按照指定比例和数量拆分成子列表:param lst: 待拆分列表:param ratios: 每个子列表的元素占比,由小数表示的列表:param num_splits: 子列表的数量:return: 拆分后的子列表组成的列表"""= 1:start = 0#遍历该目录下的所有图片文件#读取保存图像#读取txt文件并保存到tsv#中间用tab隔开(字符空格隔开,使用space表示空格)
2024-12-11 20:18:23
711
原创 easyocr配置及相关训练
参考下方链接,及其重要EasyOCR 识别模型训练(重要必看)只下载用于训练的即可这里用自己的图像集训练,可以只下载deep-text-recognition-benchmark即可,用此来进行训练。
2024-12-10 20:42:07
683
基于OpenCV的数字图像处理实验平台
2024-09-02
DNN学习平台(源码)
2024-08-30
DNN学习平台(打包好的exe文件)
2024-08-30
基于OpenCV+MFC的KCF测速软件
2024-08-26
视频读取与对象跟踪平台
2024-08-06
证件照背景底色更换工具(深度学习+扣取人像+头发丝级精度)
2022-05-09
GukehAn-VTuber_Unity-master.zip
2021-02-27
guassian-splatting(原生python版)
2026-06-17
TUM-RGBD官方数据集(5个子数据集)
2026-06-16
Fastlivo2自定义楼梯长廊数据集
2026-06-12
Fastlivo2官方数据集
2026-06-12
standford-cloud-data.zip(内含多个标准可用于测试的pcd点云)
2025-04-21
凸包边缘缺陷检测(基于C++与OpenCV开发,内含源码)
2025-04-08
LZC模板匹配算法.zip
2025-01-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅