自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 img2img——SDXL部署

VENV_DIR=- 禁止 A1111 自己再创建 venv。PYTHON 指定使用你的 conda 环境。–api 后面方便批量生成负样本。–xformers 加速、降低显存占用。–autolaunch 自动打开浏览器。如果自动下载某个仓库失败,才手动处理。其中PYTHON=路径是通过。

2026-05-22 16:12:30 200

原创 本地安装yolov11

分别找到torch、torchvision、torchaudio,然后点击后选择对应的版本。表示 64 位的 x86 架构。Windows操作系统。

2026-05-14 17:49:20 18

原创 解析.pbstream

这个能看到:trajectory 数量node 数量submap 数量。

2026-03-10 15:31:47 44

原创 linux部署VLM-R1-OVD

使用的时VMware Workstation Pro+Ubtuntu22.05VMware 本身并不直接支持 GPU 加速(不像 VirtualBox 的 3D 加速),但是您可以通过以下几种方式在虚拟机中使用 NVIDIA GPU。

2026-01-28 15:38:23 700

原创 Linux部署Qwen2-VL-72B

前往 Anaconda 官网下载适用于 Linux 的。

2026-01-28 15:27:15 248

原创 第一次_虚拟机尝试仿真+bag的slamtoolbox建图(调试版本)

wpr_simulation2 是一个基于 ROS 2 的仿真环境,主要用于:自主导航(Navigation)SLAM(如 Gmapping、Hector SLAM)键盘/遥控控制激光雷达(LiDAR)避障RViz 可视化它通常包含以下核心组件:Gazebo 仿真模型(机器人、环境)ROS 2 导航栈(Nav2)集成激光雷达数据模拟键盘控制节点。

2026-01-28 15:17:28 956

原创 VLM部分场景测试结果_2025.4.25

VLM(Vision-Language Model,视觉语言模型) 是一种可以同时处理图像和文本输入的多模态人工智能模型。可以被用于解决各种多模态任务,包括 REC (Referring Expression Comprehension,指代表达理解)和 OVD(Open-Vocabulary Detection,开放词汇目标检测 )。REC是定位:定位一个具象对象,并理解自然语言表达。OVD是识别+检测:不仅要识别图像中的目标,还要处理开放类别的挑战(比如未见过的类名也要能检测出来)。模型VLM。

2026-01-27 09:43:19 979

原创 阿里云配置yolov11环境

前往 Anaconda 官网下载适用于 Linux 的。

2026-01-22 20:10:18 364

原创 使用turtlebot3官方车,加载新世界

【代码】使用turtlebot3官方车,加载新世界。

2026-01-12 14:16:12 182

原创 MobaXterm无密码打开ssh

只需要 生成密钥 → 上传到服务器 → MobaXterm加载私钥 就可以了。这说明还没有生成 SSH 密钥,所以现在还无法设置免密登录。C:\Users<你的用户名>.ssh\id_rsa。把输出的内容复制到 Windows,保存成一个文件。

2025-12-29 10:13:58 438

原创 使用官方bag运行slam_toolbox建图(ros2环境)

rosbags-convert不依赖 ROS 1 或 ROS 2 的运行环境,只需安装 Python 和 rosbags 库即可运行。下次建图时可以通过参数 map_file_name 加载接着跑:map_file_name: /home/ubuntu/my_map。队列满了 → 丢旧的或丢新的(取决于实现)TRANSIENT_LOCAL:新订阅者也能收到之前发过的最后一条(比如 /map)它和 base_link 的关系是一个固定的外参(安装位置)。KEEP_ALL:所有消息都存下来(几乎不用,内存爆)

2025-12-11 15:20:55 741

原创 虚拟机中 gmapping 安装步骤

【代码】虚拟机中 gmapping 安装步骤。

2025-11-24 10:19:06 365

原创 解决同一局域网rviz建图互相影响到问题

【代码】解决同一局域网rviz建图互相影响到问题。

2025-11-24 10:10:25 176

原创 虚拟机扩充硬盘

手动扩充后,若扩充的内存没有加载到现在的磁盘,可按以下操作。

2025-10-29 09:49:24 258

原创 labelme标注工具使用

创建3个文件夹。

2025-10-21 12:49:14 380

原创 大文件分卷压缩

【代码】大文件分卷压缩。

2025-10-09 09:00:31 214

原创 YoLov11后处理流程

把模型原始预测 preds=(det, proto) 先做 NMS,再把 coef × proto 解码为实例掩码,并把框从输入尺度映射回原图尺度,最后打包为 Results(一图一个)。等比例缩放得到 180×320,但为了对齐 32,会 pad 到 192×320。预测结果 =(det_output, proto_output)原始图像: (360, 640)设置:imgsz=320。

2025-10-05 23:07:27 1296 1

原创 conda网络问题

需要修改隐藏文件 .condarc文件的内容,具体路径为:c:\users\用户名\.condarc。使用记事本打开,复制下面这一段进去替换掉原本所有的内容,替换完之后保存即可。

2025-09-22 14:25:09 236

原创 V3Det数据集下载

V3Det数据集下载

2025-08-20 13:59:05 465

原创 【小白教程】Labelimg安装

最后手动选择我们标注存放的路径。

2025-07-10 17:25:27 282

原创 【论文解读】LLMDet: Learning Strong Open-Vocabulary Object Detectors under the Supervision of Large

训练目标是让图像整体(整张图)和对应的文本(如一句描述)之间进行对齐。比如:“A dog playing with a ball.” ←→ 图像整图它并不区分图中具体哪一块区域是“dog”,哪块是“ball”。这就是所谓的图像级目标,也称为“图文对齐而非区域对齐”。

2025-05-07 14:59:59 1111

原创 【论文解读】YOLO-World: Real-Time Open-Vocabulary Object Detection

方向QueryKey/Value输出作用图像特征文本加权图像表示引导视觉关注文本语义区域文本图像 Patch加权文本表示增强文本的视觉感知能力📌 I-Pooling Attention 实现了图像与文本的双向交互式建模,提升视觉-语言对齐与感知能力。why?原始文本向量 W 是 CLIP 离线编码而成的;可能缺少目标图像中实际存在的上下文信息;

2025-04-29 16:39:43 1615

原创 【小白教程】本地部署VLM-R1模型(使用Docker)

通过Docker本地部署VLM-R1大模型,详细教程。

2025-04-21 20:19:54 2844

原创 IoU、Confidence和NMS区别

IoU 是用于衡量两个边界框(bounding boxes)重叠程度的指标。具体来说,它是两个框的交集(Intersection)区域面积与它们的并集(Union)区域面积之比。Confidence 是目标检测模型在预测一个边界框时,对于该框包含某个目标的 信心度。它表示模型对某个框内是否包含目标的置信度评分,通常以一个 0 到 1 之间的数字表示。NMS 是一种常用的后处理方法,用于 去除冗余的框。

2025-04-21 17:05:14 1012

原创 PyCharm注释【TODO+文档注释+块注释】

pycharm注释详解

2025-04-21 11:37:14 1272

原创 如何在 Git 中同步原始仓库的更新(含 Fork 和非 Fork 方法)

将本地提交推送到远程仓库,进入 GitHub 网站,你会看到有一个提示让你发起 Pull Request(PR),请求将 new-feature 分支的修改合并回 main 分支。你修改完 fork 的项目后,可以通过 PR 请求原作者审阅你的修改,并决定是否将你的更改合并到原项目中。:就像你在 GitHub 上“复制粘贴”了一份项目到你自己的账户里,之后你可以随意修改、创建分支,而不会影响原作者的代码。是你本地的分支名称,通常是主分支(如果你用的是 main,那就是 main)

2025-04-15 21:13:50 2511

原创 【小白入门】Docker详细教程

Docker打包Anaconda环境完整流程

2025-04-10 14:39:37 2637

原创 云 GPU

注释:8 GB GDDR5 ×2:有两个 GPU,每个 GPU 各有 8GB GDDR5,总共 16GB,但每个 GPU 只能访问自己的 8GB,使用上不如一整块 16GB。

2025-04-01 15:17:13 285

原创 云创建新实例

Shell 是用户和操作系统之间的桥梁,是一种 命令解释器,用来接收你输入的命令,翻译成系统能理解的语言。

2025-03-31 17:37:15 367

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除