- 博客(127)
- 资源 (12)
- 收藏
- 关注
原创 docker pull命令拉取镜像失败的解决方案
docker compose的时候程序报错,报错内容ERROR [api internal] load metadata for docker.io/library/python:3.docker。自己配了阿里云地址还是失败。
2026-01-31 13:07:50
111
原创 【与身俱能】机械臂训练(学习笔记)
摘要:介绍了两个开源视觉语言动作(VLA)模型项目。SimpleVLA-RL(清华等机构联合开发)通过强化学习实现少样本训练,支持多种SFT模型,适用于机器人任务。SmolVLA(HuggingFace推出)采用轻量化设计,包含视觉编码器和动作专家模块,支持异步推理,对硬件要求较低(RTX3080级别即可训练)。两项目均提供完整代码和文档:SimpleVLA-RL强调泛化能力,SmolVLA侧重部署便利性,为机器人AI研发提供了不同技术路线的选择。(149字)
2025-12-10 21:00:00
680
原创 【与身俱能】无人机智能体(学习笔记)
摘要:近期无人机智能控制研究取得新进展。北京航空航天大学团队提出AeroAgent系统,实现多模态感知与智能决策,在野火救援、视觉着陆等任务中表现优异。另一团队开发的UAV-Flow系统突破语言交互控制技术,通过真实环境测试验证了语言指令引导飞行的可行性,开放了代码和数据集。两项研究分别从多模态感知和自然语言交互角度推进了无人机智能化发展,为实际应用提供了新思路。
2025-12-03 21:00:00
1091
原创 live555(笔记)
生成前面四个以后得到4个lib,需要配置mediaServer的lib,再右击生成mediaserver,详见pdf。使用live555这个代码,这个代码是上面连接中的博主自己弄好的sln项目,然后依次生成。流媒体服务器分发RTSP视频流并发压力测试。一个将live555加入到sln中的过程。
2025-10-09 21:15:00
659
原创 netplan command not found的情况下恢复Ubuntu系统网络的方法
摘要:Ubuntu系统重启后网络无法连接,尝试了多种方法(包括修改netplan配置、NetworkManager服务、apt更新等)均无效。最终通过手动执行四条网络配置命令成功恢复网络:设置IP地址、启用网卡、添加路由和默认网关。虽然配置文件中已有相关设置,但仍需手动执行这些命令才能使网络恢复正常。
2025-07-29 14:07:31
687
原创 病虫害数据集
摘要:该研究采用Cascade RCNN和结合Swin-Transformer的Mask RCNN算法进行农田虫害识别,通过两阶段目标检测方法提高精确度。针对小目标和样本不平衡问题,采用copy-paste离线增强和多尺度训练。使用SWA权重平均和模型融合优化性能,但存在计算资源消耗大和数据增强可能产生伪影的问题。实验数据为4K图像(8GB),涵盖8类害虫,解决方案注重精度而非速度。(149字)
2025-07-07 22:00:00
667
原创 windows编译ZLMediaKit时提示3rdpart/cmakelists.txt no sources given to target jsoncpp mov flv mpeg
编译ZLMediaKit时报错"cmake error at 3rdpart/CMakeLists.txt",原因是3rdpart目录为空。解决方法:使用git克隆源码后,必须执行git submodule update --init命令下载子模块内容。国内用户建议从gitee镜像站克隆。完整步骤: git clone --depth 1 https://gitee.com/xia-chu/ZLMediaKit cd ZLMediaKit 关键步骤:git submodule updat
2025-07-04 21:45:00
455
1
原创 yolo性能评价指标(训练后生成文件解读)results、mAP、Precision、Recall、FPS、Confienc--笔记
本文总结了目标检测模型训练中常用的评估指标及其含义。主要包括:1. 损失指标(训练/验证集):框损失(box_loss)、分类损失(cls_loss)和分布焦点损失(dfl_loss),分别衡量位置预测、分类准确性和难样本处理能力。2. 性能指标:精确度(Precision)、召回率(Recall)、mAP50和mAP50-95,评估模型检测精度和泛化能力。3. 可视化分析工具:混淆矩阵(原始/归一化)、PR曲线、F1曲线等,直观展示模型分类表现。4. 其他重要参数:FPS(处理速度)、IoU(框重合度)、
2025-07-04 21:00:00
1610
原创 webrtc-streamer视频流播放(rstp协议h264笔记)
本文介绍了使用WebRTC技术实现RTSP视频流前端播放的解决方案。主要内容包括:1)下载Vue前端播放demo;2)启动webrtc-streamer服务作为推流服务器;3)关键代码解析,详细说明了WebRTC连接建立过程;4)注意事项:该方案仅支持H264格式,不支持H265,且存在服务不稳定的问题。文章提供了完整的GitHub资源和实现步骤,可作为视频流Web播放的技术参考,但需要注意其格式限制和稳定性问题。
2025-07-03 20:45:00
2366
1
原创 YOLOv11剪枝与量化(三)8位量化技术原理
深度学习量化技术将32位浮点数模型转换为低精度(如8位整数)表示,以降低存储需求和计算资源。主要分为线性量化和对称量化两类,方法包括静态量化、动态量化和量化感知训练。8位量化可减少模型存储需求至1/4,提升计算速度,但可能带来精度损失。合理选择量化方法可控制精度损失在可接受范围内。实验表明,部分模型量化后精度下降不明显。文末提供了Python实现的线性量化示例代码,展示了量化与反量化过程。该技术特别适用于资源受限的边缘设备部署。
2025-07-02 20:45:00
1427
原创 YOLOv11剪枝与量化(二)通道剪枝技术原理
YOLOv11模型通道剪枝优化方法 通道剪枝是一种有效减小YOLOv11模型复杂度、加速推理的技术。实施步骤包括:1)理解模型架构;2)选择结构化或非结构化剪枝策略;3)确定剪枝比例并评估通道重要性;4)重构网络结构,修改卷积层参数;5)进行特征图重构以最小化性能损失;6)对剪枝后模型进行微调。该方法能显著减少参数量和计算量,但需平衡剪枝比例与精度损失,过度剪枝可能影响模型泛化能力。实施时可借助PyTorch等框架的剪枝工具或手动实现。
2025-07-02 20:30:00
1255
原创 YOLOv11剪枝与量化(一)模型压缩的必要性
边缘设备因计算资源有限面临深度学习模型部署的挑战,模型压缩技术成为解决方案。通道剪枝去除影响小的通道,8位量化将浮点数转为8位整数,两者各有优势:量化显著减小模型大小(约70%)且加速明显,剪枝在合理比例下(20%-30%)能平衡压缩与性能。综合应用时,先剪枝后量化效果更佳。实际应用中需根据场景选择:量化适用于存储严格限制的场景,剪枝适合精度要求高的应用,联合优化策略可最大化压缩效果。优化方法包括智能通道评估、自适应量化参数调整等。
2025-07-02 19:45:00
1272
原创 yolov1-yolov13的进化总结
实时目标检测领域YOLO系算法迎来新成员YOLOv13, 标配N/S/L/X不同规模的模型,性能更强,调用简单,可通过Ultralytics包直接测试和训练。
2025-07-01 19:00:00
1175
原创 glb模型压缩draco使用教程windows
发现除了ply格式的其他格式都不支持,然后按照下面的蓝色文件夹截图说明,用html文件打开drc也打不开,没法预览,建议使用第二种方案。5的前提是系统安装有Visual Studio 2022,打开后,直接右击选择生成即可。压缩通常可以将 GLTF 和 GLB 文件的大小减小到其原始文件的。下载cmake3.23.4,打开cmake-gui.exe文件。会生成draco_decoder.exe文件。配置用默认的即可,需要选择一下目录。官方的说明文档,包含如何用。一、项目地址下载源码。
2025-02-25 20:30:00
1139
1
原创 将DeepSeek接入vscode的N种方法
接入deepseek方法一:cline步骤1:安装 Visual Studio Code 后,左侧导航栏上点击扩展。步骤2:搜索 cline,找到插件后点击安装。……
2025-02-24 15:03:22
4876
原创 铁路公开数据集(包含雷达3d数据、车载摄像头数据,标注数据)
数据集下载链接,进到网址里面以后点击右侧的红色按钮即可下载。这个数据集超级大,上百G,下载慢,需要外网,一个国外的地址。其数据包含不同时段,白天,晚上,图像以车载传感器为主。数据内容很多,就不一一截图示范了,自己打开看吧。图像数据 rgb highres left文件夹。分为车头正前方,左侧、右侧、imu数据、标注数据。解压了一个其中的各文件夹内容。雷达数据,lidar文件夹。关于数据的话还是挺全的。
2025-02-24 13:45:45
1813
1
原创 本地部署--LM Studio 0.3.9无法下载模型--通过“设置”即解决
不用AnyThingLLM和Ollama,推荐一个简单的部署deepseek的方法,仅需几步就可以完成部署
2025-02-12 11:56:17
982
原创 关于目标检测YOLO 各版本区别v1-v11/X/R/P
关于目标检测YOLO 各版本区别v1-v10/vX/vR,,,,,,,YOLO是一系列开创性的实时目标检测模型,它们彻底改变了计算机视觉领域。由Joseph Redmon开发,后续版本由不同研究人员迭代,YOLO模型以其在图像中检测对象的高速度和准确性而闻名。
2024-12-16 21:30:00
2794
原创 win10远程ubuntu服务器桌面且显示图像窗口工具及配置说明
win10远程ubuntu服务器桌面且显示图像窗口工具及配置说明,仅需一个MobaXterm_Personal工具就可以实现网上的教程比较多,实现起来比较复杂,这个是经过自己的钻研找到的方法(请勿转载和抄袭)
2024-07-15 20:15:00
581
1
原创 mmaction2的GPU环境配置记录RTX3090,cuda12.2,ubuntu22.04版本
mmaction2的GPU环境配置记录RTX3090,cuda12.2,ubuntu22.04版本,安装环境配置记录,所有的安装命令及注意事项
2024-07-12 20:15:00
1628
11
原创 MMACTION2行为识别项目配置及注意事项——海康摄像头调用
MMACTION2行为识别项目配置及注意事项——海康摄像头调用标注文件、权重文件配置,详细的执行、安装命令,及安装错误调试等
2024-07-12 16:32:47
1079
原创 关于bim数字孪生threejs中使用glb文件大小优化及加载慢的说明(笔记)
在用three.js开发的时候发现,稍微大一点的glb或者fbx文件加载的时候很慢很卡一直不理解这个卡和慢取决于哪些条件,下面来详细说一下。
2024-06-28 21:15:00
1837
1
原创 5个下载3d模型地址glb/3dmax/Blander等格式
glb模型下载,gltf模型下载,FBX模型下载,数字城市模型下载,VR模型下载
2024-06-14 20:45:00
13820
原创 英伟达文本生成3D模型论文:Magic3D: High-Resolution Text-to-3D Content Creation解读
摘要:DreamFusion 最近展示了使用预训练的文本到图像扩散模型来优化神经辐射场 (NeRF) 的实用性,实现了显着的文本到 3D 合成结果。然而,该方法有两个固有的局限性:(a)NeRF 的优化极慢和(b)NeRF 上的低分辨率图像空间监督,导致处理时间长的低质量 3D 模型。在本文中,我们通过利用两阶段优化框架来解决这些限制。首先,我们使用低分辨率扩散先验获得粗略模型,并使用稀疏 3D 哈希网格结构进行加速。
2024-03-29 22:08:25
1795
原创 关于NeRF方向的三维重学习笔记
由光源发出的光线在场景中的传播和反射过程中所形成的。通俗来说就是一个函数,记录了空间某个位置处向某个方向的辐射信息,辐射信息(或者说能量分布)其实就是颜色、亮度、阴影等信息。:用空间向任意的辐射。NeRF是,因为模型是储存在MLP里面的,模型就是MLP的参数,这和以往点云和不同(点云/mesh是可以直接看到模型的)。NeRF必须查询一个个的三维点,然后渲染成一张图像。这种或者说就叫。
2024-03-25 21:12:18
1573
6
原创 填充点云孔洞(较大的洞)halcon算法
步骤一:找到孔洞所在平面步骤二:对点云进行旋转,使孔洞可以投射到一个规则的面上步骤三:对孔洞所在面进行投影操作,使之变成二维图步骤四:对二维图进行分析,用fill_up和difference 即可得到孔洞的位置步骤五:计算孔洞的z值步骤六:将孔洞还原至原始点云中
2024-01-01 16:00:42
2581
4
原创 影响机器视觉测量精度的因素有哪些?
在机器视觉测量中提供高精度和低不确定度的决定性因素是获取的图像的分辨率。在这种情况下,术语分辨率 (或图像分辨率)意味着以实际单位的单个像素的大小。简而言之,如果一个摄像机传感器在水平方向上包含1000个像素,并且采用光学器件来获取覆盖真实世界场景中1英寸宽的区域的图像,则单个像素将代表0.001“。请注意,这是相机制造商或分析软件不会改变的基本指标。一个特定的应用程序有多少像素就足够了?作为一种衡量标准,机器视觉系统中最小的测量单位(稍后提到的一些例外情况)就是单个像素。
2023-11-27 20:54:17
2724
1
原创 人工智能关键技术决定机器人产业的前途
目前的机器人已经能够胜任精确、重复性的工作,但很多时候,它还不能够灵活地为新任务进行自我调整,也不能应付一个不熟悉的或不确定的情景。不过,这些情况都在发生改变,机器人正在变得更加智能。我们不禁要问,让机器人实现智能的关键技术到底是什么?这些技术在近十年会发展到什么程度?整个产业的应用前景将会如何?随着家用机器人的应用需求不断增加,人工智能相关技术不断进步,硬件性能的增长,服务机器人近年来开始从实验室走向家庭,并从扫地机器人等单一功能向多功能的个人机器人发展。
2023-11-27 20:13:33
1432
原创 深度学习标注工具(包括自动标注)总结——持续更新
能标注矩形、圆、椭圆、多边形、点和折线标注,VGG 有一个亮点,根据标签 ID 可以自定义不同的标签名称,在遇到复杂难懂的标签名称时,我们也能轻松搞定,支持对象检测、图像语义分割与实例分割数据标注,人脸数据标注首选工具。支持图像分类、对象检测框、图像语义分割、实例分割数据标注在线标注工具,它能够对图像、视频做矩形、关键点、图像分割、目标追踪、3D等标注(矩形、圆形、线段、点(多边形分割、语义分割、2D框、线标注、点标注(可用于目标检测,图像分割等任务)、语义分割、2D框、线标注、点标注,
2023-10-24 20:15:00
5339
3
原创 【已解决】OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.
解决办法:是将bin里面的……删除。
2023-10-03 20:27:04
639
原创 对图像中边、线、点的检测(支持平面/鱼眼/球面相机)附源码
本文提出了一种统一的线段检测方法(ULSD),用于检测平面、鱼眼和球面图像中有畸变和无 畸变的线段。最近,人们提出了一个更高层次的线段检测 任务,即线框解析,以联合检测有意义和显著的线段和线段端点。在端点的约束下,输出的 线段在线的完整性和对噪声的鲁棒性方面明显提高。基于所提出的Bezier曲线表示和流行的线框表示,我们设计了一种用于统一线段检测的端到端 神经网络,即ULSD。本工作的目的是开发一种简单而有效的统一线段表示和一种基于学习的检测方法,直接输出 针孔、鱼眼和球形图像的矢量化线段。
2023-10-03 20:15:54
1132
原创 鱼眼相机去畸变(图像拉直/展开/矫正)算法及实战总结
1、算法说明经纬度矫正法, 可以把鱼眼图想象成半个地球, 然后将地球展开成地图,经纬度矫正法主要是利用几何原理, 对图像进行展开矫正。经过P点的入射光线没有透镜的话,本应交于相机成像平面的e点。然而,经过鱼眼相机的折射,光线会交于相机成像平面的d点,就产生了畸变,因此畸变图像整体上呈现出像素朝图像中心点聚集的态势。而去畸变,就是将折射到d点的点,重新映射回到e点,因此去畸变之后的图像与原始的鱼眼图像相比,仿佛是把向心聚集的像素又重新向四周铺展开来。AVM环视系统——鱼眼相机去畸变算法 - 知乎。
2023-10-03 19:33:20
19923
2
原创 ABB工件坐标系计算实现原理与代码
所以,在我们建立工件数据时,只需要确定用户坐标系的原点位置和坐标轴方向即可。2、ABB机器人默认定义工件坐标系时,采用上述方法,即p1、p2所在的直线构成x轴方向,p3到p1、p2的垂线交点为坐标系原点,即p4(x,y,z)点。从工件数据的定义可知,我们自定义的工件数据只需要确定两个方面的内容,分别是用户坐标系的原点位置和用户坐标系的坐标轴原点姿态(方向)。如下图所示,已知空间不在同一直线上的任意三点p1(x1,y1,z1)、p2 (x2,y2,z2)和p3(x3,y3,z3)的坐标。
2023-08-29 17:44:07
733
原创 曲面(弧面、柱面)展平(拉直)瓶子标签识别ocr
瓶子或者柱面在做字符识别的时候由于变形,识别效果是很不好的或者是检测瓶子表面缺陷的时候效果也没有展平的好下面介绍两个项目,关于曲面(弧面、柱面)展平(拉直)
2023-08-18 19:30:00
4839
原创 基于深度学习的指针式仪表倾斜校正方法——论文解读
针对仪表图像自动识别中倾斜仪表产生的读数误差,提出一种基于深度学习的圆形指针式仪表快速倾斜校正方法,可以实现仪表图像的倾斜校正和旋转校正,该方法利用卷积神经网络提取以表盘刻度数字为中心的关键点并采用最小二乘法对关键点进行椭圆拟合。 结合椭圆变换理论使用透视变换对仪表图像进行第 1 次倾斜校正,再根据一对关于仪表竖直中轴线对称的关键点计算仪表相对于水平方向的旋转角度,以拟合椭圆的几何中心为旋转中心旋转仪表图像实现第 2 次校正。 在变电站真实环境下采集图像数据,验证方法性能,实验结
2023-08-16 19:45:00
1751
原创 基于视觉的仪表检测/指针仪表自动识别读数——论文解读
本章以变电站中的多种类别的指针仪表作为研究对象,探究能够自动识别仪表读数的方法。指针仪表自动读数任务的关键在于指针仪表的定位以及指针与刻度点之间的角度关系。本文提出了一种基于 Mask RCNN 改进的精确关键点检测算法,相比原始的MaskRCNN,本文设计的网络在关键点检测方面具有更高的精确度,并据此提出了基于关键点检测的指针仪表自动读数识别算法框架,该框架具有精确度高、鲁棒性好、适用性广等特点。
2023-08-15 20:00:00
2720
4
原创 【已解决】pcl引用头文件convolution_3d.hpp时报错
在做pcl的高斯滤波/卷积滤波的时候,引用convolution_3d.hpp出现问题,报下面的错误当前pcl版本号为pcl1.12.1。
2023-07-17 19:15:00
714
2
原创 在工作中如何保持稳定的情绪
在工作中,拥有积极主动的心态是非常重要的。当你能够以积极的态度面对工作时,你会更有动力去解决问题、创造机会和取得成就。相反,如果你总是消极被动,就很难在工作中获得成功和快乐。当自己开心了,就能获得更稳定的情绪。及时排除自己的不良情绪。
2023-07-07 20:15:00
249
原创 pcl经典算法60例——所有代码参考链接(开源)
统计密度滤波、直通滤波器、中值滤波、双边滤波、多幅点云配准、PCA主方向、生成包围盒、协方差矩阵、生成切片、曲率特征提取、最大曲率、绘制曲率图、按曲率值上色、区域生长分割、欧式聚类分割、计算两面交线、拟合直线、合并两个点云、移除边不连续点、多项式曲线绘制、点云转深度图、计算点云边界、深度图找边界
2023-07-06 20:45:00
860
json格式的中文字体库threejs支持的格式
2024-09-27
深度学习数据集:烟雾火焰数据集(2000个图像)
2023-10-24
受电弓数据集训练集1197张图标注为voc格式
2023-08-24
voc格式轮胎缺陷数据集训练集884张测试集46张
2023-08-24
山体地貌点云.vtk格式的点云用于vtk库的使用及计算
2023-08-22
.vtk格式的点云用于测试vtk库的点云
2023-08-22
曲面(弧面、柱面)展平(拉直)瓶子标签识别ocr
2023-08-18
指针式仪表倾斜校正opencv算法python代码及仪表图像(包含倾斜的和模板图像)
2023-08-16
汽车表面划痕voc深度学习数据集
2023-08-15
pcl读取点云并显示在嵌入窗口picture control中c++源码
2023-07-22
中国移动研究院发布的《我国人工智能大模型发展动态》2023年4月
2023-07-18
vs2022+win10 生成的CSF.lib库用于计算布料滤波的库结合pcl调用
2023-07-12
java写的modbus接口
2023-07-06
去雾python源码使用opencv库
2023-06-27
实时检测aruco标签-增加卡尔曼滤波算法
2023-06-21
A4纸可打印的15mm的9行6列的黑白棋盘格
2023-06-07
halcon的接口用于python的调用程序(三)
2023-05-09
halcon的接口用于python的调用程序(二)
2023-05-09
webrtc-streamer的一个demo前端vue代码
2025-07-03
安全帽检测模型yolo11n训练的模型
2025-06-23
threejs前端模型会走路的人模型gltf格式模型包含动作action
2025-02-25
吸烟识别模型yolov5权重文件pt格式
2025-02-25
玩手机识别模型yolov5权重文件pt格式
2025-02-25
口罩识别模型yolov5权重文件pt格式
2025-02-25
灭火器正常检测模型yolov5权重文件pt格式
2025-02-25
安全帽安全服检测模型yolov5权重文件深度学习模型pt文件
2025-02-25
点云的凹陷缺陷如何检测
2023-05-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅