自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(306)
  • 资源 (15)
  • 收藏
  • 关注

原创 医学图像2025-2026分割方向文章精选

本报告针对国际期刊Computers in Biology and Medicine(CBM)在2025年和2026年发表的图像分割(Image Segmentation)与目标检测(Object Detection)方向的开源论文进行系统性调研。CBM是计算机科学与生物医学交叉领域的顶级期刊,影响因子稳定在较高水平,其发表的论文在医学图像分析、深度学习辅助诊断等方面具有重要的学术影响力。

2026-04-30 14:02:35 378

原创 视觉 / 多模态强化学习 主流环境与开源案例汇总

以下内容分为核心训练 / 评测环境和经典 & 前沿落地案例两部分,覆盖从入门级基准到工业级框架,全部包含开源方案与核心特性,适配 2025-2026 年最新技术进展。

2026-04-30 13:58:40 375

原创 无人机智能体的实现的一些思考

最近打算实现一个基于无人机场景的智能体,能够统一这个领域的一些相关应用。

2026-04-28 18:56:12 77

原创 世界目标检测(Open-Vocabulary Detection)领域前沿模型与技术调研报告

开放词汇目标检测(Open-Vocabulary Object Detection,简称OVD)是计算机视觉领域近年来最具突破性的研究方向之一,旨在使目标检测模型能够识别训练过程中未曾见过的物体类别,从而实现真正意义上的“万物检测”。随着视觉-语言预训练模型的快速发展,特别是CLIP、DINO等技术的成熟,OVD领域在2023至2025年间迎来了技术爆发的关键时期。本报告深入调研了该领域的核心技术路线、主要前沿模型、重要技术突破以及应用场景,为研究者和工程师提供全面而系统的技术参考。

2026-04-01 14:15:01 133

原创 lightrag最全教程

参见我的cadn博客https://blog.csdn.net/luoshiyong123/article/details/158497222?spm=1001.2014.3001.5501LightRAG 是一个 基于知识图谱的检索增强生成(RAG)框架 ,与传统RAG的主要区别:参数名称默认值说明kv_storageJsonKVStorage键值存储vector_storageNanoVectorDBStorage向量存储graph_storageNetworkXStorage图存储doc_status

2026-03-02 09:28:47 72

原创 lightrag安装和部署

如果遇到1的错误,这里是bun的版本问题,请卸载原来的版本,并安装v1.3.5版本。最后启动lightrag-server。(3)配置llm和embedding。(1)安装lightrag。(2) 安装webui。安装bunv1.3.5。这里应该就能正常安装了。

2026-02-28 10:15:41 85

原创 目标匹配系列一之superpoint

采用类 VGG 的卷积主干(5 层卷积,无池化,步长 1,padding 保持特征图尺寸为输入的 1/8),输出 128 维特征图(H/8×W/8×128),为双分支提供共享特征。:将编码器输出扩展为 65 通道(8×8 像素块内 64 个位置的角点概率 + 1 个无角点概率),经 Softmax 得到概率图,再通过非极大值抑制(NMS)筛选出离散关键点坐标。(3)对第二步使用的图片进行几何变换得到新的图片,这样就有了已知位姿关系的图片对,把这两张图片输入SuperPoint网络,提取特征点和描述子。

2026-02-09 15:00:09 83

原创 SAM3自动标注(segment anything3)

​ 与sam,sam2不同,sam3新增了对于text prompt的支持,也引入了“类别“的概念。​ 分割结果仍然很炸裂,感觉比许多抠图的模型都好。​ 在推理视频的视频也兼容了图片文件夹(

2026-02-06 15:39:41 181

原创 qwen2.5vl源码解析

​ 在vit中比如划分patch是:756//14=54,1008/14=72,那每一个向量长度就是3*14*14=588长度,一共有54*72=3888个图像块,但是这里多了个时间维度2,所以向量长度就为3*2*14*14=1176。processor中处理text代码如下。

2026-02-03 20:37:28 64

原创 图像与点云融合技术综述:近年来相关论文整理

对齐策略:从硬投影到软关联,从显式对齐到隐式学习,注意力机制和Transformer架构的引入显著提升了对齐的灵活性和鲁棒性。融合方法:从早期融合、深度融合到统一BEV空间融合,融合策略不断优化,在保留各模态优势的同时实现高效的信息整合。应用效果:在KITTI、nuScenes、Waymo等主流数据集上,融合方法相比单模态方法取得了显著的性能提升,特别是在远距离和小目标检测等难点场景中。发展趋势。

2026-01-22 15:36:59 838

原创 rknn模型部署技巧

【代码】rknn模型部署技巧。

2025-12-23 16:17:20 47

原创 mnn大模型推理之编译MNN

本文介绍了使用llm-export工具导出Qwen2.5-0.5B模型的过程。首先通过源码安装llm-export,下载模型并测试效果后,将其导出为ONNX和MNN格式(支持自定义量化参数)。然后尝试编译mnn-llm库运行模型失败后,转而编译MNN主库成功运行demo。文章详细记录了各步骤的命令行操作,包括模型导出、编译选项和运行结果,为相关开发者提供了实践参考。

2025-12-09 18:52:50 180

原创 第一课 安卓UI熟悉

这里的src/main/java/com.example.myui/MainActivity.kt是文件入口,然后在res下边建立一个xml界面文件,这个文件就是如何制作app的界面的,界面制作支持两种方式,一种就是通过在android里边直接点进去,这里会有很多的空间,通过拖拉拽,然后设置布局来设置界面,另外一种通过代码写布局,在AI没有出来之前肯定是第一种方便,但是现在直接通过大模型生成xml内容即可。之后就可以根据句柄去设置不同控件的回调函数,来做一些复杂的操作了。

2025-12-08 08:49:56 77

原创 ue和airsim目标定位原理

(1)⽆⼈机⻜⾏⾼度低于3000⽶,这样可以把地⾯近似为平⾯,⽽⾮球体模型(2)待检测⽬标处于地平⾯上,⽽⾮建筑物之上,否则⽆法准确定位(好像也可以)

2025-12-04 11:41:13 61

原创 airsim中的setting文件配置详细解析

【代码】airsim中的setting文件配置详细解析。

2025-12-02 20:10:15 82

原创 ubuntu中docker环境使用界面方法

【代码】ubuntu中docker环境使用界面方法。

2025-11-27 17:25:41 69

原创 Pix2seq全文解析

本文介绍了Pix2Seq目标检测框架,该框架将检测任务转换为语言建模问题。主要内容包括:(1)将检测标注转为token序列的方法,包括坐标离散化和特殊标记定义;(2)图像编码和解码过程,详细说明了掩码生成机制和Transformer解码器结构;(3)损失函数和预测头的实现方式;(4)对方法的评价,指出其简化了传统检测流程,但存在token生成效率问题。该方法创新性地使用语言模型思路解决检测任务,虽在推理效率上存在不足,但在大模型时代具有发展潜力。

2025-11-08 10:30:30 68

原创 未来更新计划

1.如何用大模型+强化学习去提高像素级别分割的效果。2.强化学习+视觉去做定位+避障+导航。

2025-09-25 14:14:40 56

原创 vscode代码同步服务器

为什么会写这篇帖子,是因为往往本地没有运行环境,但是本地可以连接公司的git,要想做到既能快速保存写代码过程中的每一处小的修改,也能做到服务器运行代码,在本地写代码,服务器运行,本地和服务器自动同步是个好的解决方案。

2025-08-30 15:55:24 235

原创 wsl查看磁盘文件并清理空间

【代码】wsl查看磁盘文件并清理空间。

2025-07-05 16:51:06 339

原创 无人机机器人资源整合

FAST_LIO。

2025-06-10 15:09:46 460

原创 windows笔记本连接RKNN3588网络配置解析

这里如果本机是windows电脑的话,直接将以下的文件放(https://pan.baidu.com/s/1HRuZ0BlKFP65PEp1-16qFw?这几天拿到了一块RKNN3588的板子,准备做视觉和Ros开发用,但是拿到后就蒙蔽了,不知道怎么ssh连到板子上去,更甚者不知道怎么配置网络让RKNN能够联网更新环境,这里记录一下整个过程。:RKNN板子插上电源以后,通过USB-typec接口一端连接板子,一端连接电脑即可。如果是ubuntu环境的话,就更简单了,直接执行以下命令即可。

2025-05-18 20:25:29 569

原创 ubuntu22.04编译PX4无人机仿真实践

如果某个python包安装失败,可以单独通过其他源来安装。编译完成即可显示:Ready for takeoff。克隆PX4源码,并且更新子模块。

2025-05-13 10:31:56 1019

原创 RKNN3588配置推理环境

【代码】RKNN3588配置推理环境。

2025-05-12 15:04:08 195

原创 LLaMA-Factory微调DeepSeek-R1-Distill-Qwen-7B

根据患者的详细病史和实验室检查结果,可以得出以下结论:\n\n1. **病因分析**:\n - **细菌感染**:尤其是Streptococcus pyogenes,可能导致关节炎,常见于儿童。\n\n4. **治疗转归**:\n - **切开引流后体温下降**和**急性症状消退**:说明感染得到了初步控制,可能细菌已被清除。从不同的角度来看,答案可能会有所不同:\n\n1. **从生物学角度来看**:鸡的形成需要经过漫长的进化过程,可能需要先有母鸡或其他条件,然后再有蛋的出现。

2025-05-07 15:01:34 577

原创 目标跟踪最新文章阅读列表

2025-04-27 14:30:01 238

原创 nvidia-smi安装显卡驱动

发现是显卡供电不够的原因,一天白干。

2025-04-17 14:58:53 143

原创 docker常用命令

【代码】docker常用命令。

2025-04-16 09:57:45 113

原创 mmdet支持custom数据集格式读取和评测

在使用mmdet过程中,通常使用coco格式的数据格式,或者使用cocoapi进行精度的评测,不得不说一句太麻烦了,因为通常我们的det标注都是通过labelme或者其他标注软件来的,而且coco格式的标注把所有的数据放到一起不利于对单个文件管理。parse_data_info和filter_data两个方法。如果有不懂的欢迎提问~

2025-04-15 09:20:28 207

原创 检测及分割常用标注格式转换

【代码】检测及分割常用标注格式转换。

2025-04-15 08:03:40 283

原创 yolov8以及yolov10增加小目标检测层

【代码】yolov8以及yolov10增加小目标检测层。

2025-03-29 11:17:55 552

原创 unet/transunet/setr结构PPT图

unet,transunet,setr网络结构

2025-03-29 11:04:38 735

原创 qwen2.5vl技术报告解读

通义千问

2025-03-28 20:55:31 578

原创 python面试高频考点(深度学习大模型方向)

在Python中,上下文管理器(Context Manager) 是一种通过 with 语句管理资源的协议,确保资源(如文件、数据库连接、线程锁等)在使用后被正确释放,避免资源泄漏return self.file # 返回资源对象self.file.close() # 确保文件关闭# 使用示例3.python中的函数传参是传值还是传引用?变量是对象的标签:Python中变量本身不存储值,而是存储对对象的引用(即内存地址)。

2025-03-24 22:27:59 704

原创 Linux系统增加用户用于深度学习

【代码】Linux系统增加用户用于深度学习。

2025-03-07 20:28:04 128

原创 pyqt实现yolov8主界面和登录界面以及数据库

【代码】pyqt实现yolov8主界面和登录界面以及数据库。

2025-03-06 19:40:30 290

原创 mmdet数据读取过程解析

最近在将mmdet适配到自己的数据上,经过研究发现mmdet仅支持coco,voc等少数几类数据集,所以需要自己重新写一个dataset来解决,顺便熟悉一下mmdet的数据读取过程,这里以检测任务的yolov3为模型,voc数据集为例子来解析这个过程1.数据读取过程解析 这里在mmdetection/mmdet/datasets/cisdi.py新建了一个数据集CisdiDataset,其中内容参考voc数据集这里的JsonData

2025-02-12 15:41:22 159

原创 vscode调试常用选项

在vscode调试过程中,存在一个文件来控制调试的相关选项,位置为mmdetection/.vscode/launch.json。

2025-02-12 15:23:43 101

原创 目标检测之DINO详解

相比之下,我们的混合查询选择方法仅使用前K个选定特征来增强位置查询,并保持内容查询的可学习性不变。method for anchor initialization,a look forward twice scheme for box pre diction,在coco上使用resnet多尺度特征获得了(和DN-DETR相比)+6.0AP和+2.7AP的显著提升(12epoch和24epoch),DINO在取得更好结果的同时,显著减少了模型大小和预训练数据量。在DETR和DN-DETR 中,解码器。

2025-01-01 15:10:00 511

原创 基于ultralytics库的RTDETR独家大全(原创)

RTDETR作为目标检测和分割领域的新兴技术,具有巨大的发展潜力。通过本专栏的基础入门和高阶创新改进部分的学习,读者将能够全面了解RTDETR的基本原理、实现方法以及优化策略,为进一步的研究和应用打下坚实的基础。期待与大家一起在视觉大作战专栏中探索RTDETR的无限可能!

2024-12-31 22:34:44 1696 4

医学图像语义分割模型unet,transunet,setr网络结构图PPT

医学图像语义分割模型unet,transunet,setr网络结构图PPT

2025-03-29

pyqt+yolov5+mysql界面

使用mysql和pyqt集成yolov5实现的车辆识别系统,适合初学yolo,pyqt和mysql的学生以及社会人士,界面简洁好用

2025-03-06

ATSS实现方式-放在ultralytics/utils下

ATSS实现方式-放在ultralytics/utils下

2024-12-27

arduino四轴定高加单方向壁障代码

该代码用于四轴+arduino单片机加超声波模块实现单方向壁障和定高

2018-09-15

五子棋c++实现代码

用c++实现五子棋游戏,有啥不懂的可以私聊,热心帮助您

2018-09-15

ProcessGET.zip

主要是通过QProcess实现cmd命令tasklist,然后再将得到的信息写到表上,但是表中英文显示居然会乱码

2019-10-21

QT实现TCP客户端和服务器

该代码是用QT实验TCP连接,分别构建了客户端和服务端界面

2018-12-04

基于QT实现的植物大战僵尸游戏.7z

qt版本开发的植物大战僵尸,下的大佬的给大家分享,有完整的设计文档,游戏真的不错,分享给大家。 玩家通过武装多种植物切换不同的功能,快速有效地把僵尸阻挡在入侵的道路上。不同的敌人,不同的玩法构成五种不同的游戏模式,加之黑夜、浓雾以及泳池之类的障碍增加了游戏挑战性。

2019-11-10

QT串口调试工具(用于stm32串口通信)

该资源为qt实现串口通信的小软件,我用于stm32串口通信,希望对你有所帮助

2018-11-30

QT实现基于TCP协议的文件传输

该段代码用QT实现了基于TCP协议的文件传输,主要用于学习

2018-12-05

QT版中国象棋

本资源用QT/c++实现中国象棋,旨在练习qt界面设计和面向对象编程思想

2018-12-02

浙大计算机考研资料收集

包括全套408统考真题,各门考纲,招生专业,等等等等。

2018-09-15

静态web服务器

静态web服务器,工作于linux下,用纯c语言开发,适合新手入门

2019-03-16

The C programming Lanuage

关于c的深入理解,适合各类需要了解c的各行各业人士。

2018-09-15

acm入门资料

ACM新手入门资料,包括各种入门算法与数据结构,包括各种典型例题

2018-09-15

MFC计算器模板

该压缩包为MFC简单的输入输出,大概给了一个win32程序样子,带有注释,希望大家能看懂

2018-09-21

shell编程实例

shell编程实例,讲解unix关于shell的各种操作,以及各种例子

2018-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除