自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(188)
  • 收藏
  • 关注

原创 7.bundlesdf本地安装

永久设置环境变量(可选,避免每次重启终端失效)下载好4.11.0.zip文件后,解压源码。1,opencv4.11.0安装。

2026-05-30 16:51:01 59

原创 7.Gemini相机+yoloseg+foundationpose环境搭建及应用

系统:ubuntu22.04 ROS2由于ros2环境是自带的python10,而foundationpose环境是python11,所以该demo用两个环境实现功能,ros2负责获取相机参数以及分割目标物体,foundationpose接收数据后获取目标物体的位姿态,中间由socket进行发送信息和接收信息。

2026-05-28 11:24:40 246

原创 6. Gemini相机+yoloseg+foundationpose环境搭建及应用

1.获取相机的数据,然后通过相机内参将像素坐标转换为相机坐标;3.把深度图的深度值和分割的彩图值结合构成3维数据;4.foundationpose对3维数据找位姿。2.yolov8的分割模型获取抓取物体的烟码;1.2 foundationpose环境搭建。系统:ubuntu22.04 ROS2。1.1 分割环境和open3d环境的搭建。项目用conda搭建环境。

2026-05-22 09:34:03 221

原创 5.rgbd相机的手眼标定

新建一个FoundationPose文件夹,在该文件夹下实现foundation功能。

2026-05-07 10:08:15 75

原创 4. vla环境搭建与运用

仿真:用或VLA-Arena收集2. 真机:用 ROS2 订阅/cmd_vel,同步时间戳存 HDF5。

2026-05-06 08:59:30 402

原创 3.gemini336相机在ubuntu22.04的ros2下运行

若ros2 pkg list | grep orbbec命令后有orbbec_camera、orbbec_camera_msgs、orbbec_description,则这个命令的验证成功,如果空白,没有这些的输出,则编译失败,有可能是ros2的。已经被打包进 Ubuntu 的 ROS 2 软件源里了,直接一条命令就能安装,完全不用下载源码)5.安装 udev 规则(源码版专用脚本)安装完成后,直接重新编译Orbbec 包(1.创建 ROS2 工作空间。

2026-04-27 11:36:33 487

原创 2. BundleSDF的虚拟环境搭建

在这里,从零开始:完整搭建 conda环境下的BundleSDF。

2026-04-22 14:19:26 509

原创 1.tianyi_ros2_perception环境搭建

在这里,从零开始:完整搭建。

2026-04-18 22:09:22 395

原创 15.Slam算法的环境搭建与测试

环境搭建核心:虚拟机重点要分配足够的内存 / CPU,更换国内源解决下载慢,rosdepc 替代 rosdep 解决初始化失败;使用核心:虚拟机只能跑离线数据集(TUM/EuRoC),验证 SLAM 算法的建图 / 定位逻辑,熟悉参数调整;进阶方向:等熟悉基础后,装双系统(物理机 Ubuntu),连接摄像头 / 激光雷达跑实时 SLAM。如果运行过程中遇到具体报错(比如编译失败、数据集跑不起来),可以把报错信息发给我,我帮你定位解决。

2026-01-18 10:17:34 799

原创 14.1 人脸的三维重构(PRNet算法)

我们在写了colmap的三维重构的环境搭建与使用,该算法可以重构任意的物体,但对拍照要求比较高,本文介绍的PRNet算法专门用来三维重构人脸,并且单张图片就可以重构。

2025-12-24 14:31:35 385

原创 14.三维重建colmap环境安装与使用

1.1 conda 环境下的colmap安装。若 conda 环境持续冲突,直接从源码编译。

2025-12-23 12:16:32 759

原创 13.长视频和短视频的目标追踪(yolo_insightface模型)

在视频中提取出了5个id,而视频中实际上只有这5个人,我另外运行了3个视频,最后追踪的结果没有重复的头像,也没有漏掉的头像。运行时间和图片中的人头个数成正比,insightface检测每个头像的时间约为0.08s~0.2s之间。(Anaconda/Miniconda)创建独立环境,也可使用。在2.1搭建环境里运行以下代码即可。InsightFace 依赖。

2025-12-16 14:32:11 560

原创 10.识别视频中的场景切换

这个代码能识别视频中的场景切换。

2025-12-03 10:49:15 153

原创 12.rf-detr目标检测模型的环境搭建、数据集制作、模型训练和预测

这是测试结果,3个类的置信度都大于0.9,我用yolov8以相同的数据集训练模型,测试的置信度都小于0.8,可见该模型的效果更好,但该模型的pth文件500M左右,而yolo模型的pth文件只有6M左右。上面图片是images和labels文件夹,分别放图片和标签,最下面的txt文件里面是标签的所有类别,类别的存放方式如上图中打开的txt文件,这个文件有3个类别。,然后下拉页面,可以看到如下图的一个.zip文件的源代码下载,点击后得到一个zip的压缩文件,并解压zip文件。至此,模型训练完成。

2025-11-28 16:01:38 675

原创 11.2 yolov8用自己的数据集训练语义分割模型

本文看了博客和博客,将两个博客的内容串着操作了一遍,这里作为笔记用。1.下载下载后打开labelme.exe文件得到如下图:2.新建label保存标签上图中,images是图片的文件夹,json文件是标注后存放json文件的文件夹,然后打开数据集文件进行标注。

2025-07-24 16:39:08 973

原创 3.3 WPF读取txt文件画折线图

Grid> ...</Grid>之间的所有代码复制到里面就行。

2025-07-14 14:27:31 353

原创 3.2 WPF 画散点图

Grid> ...</Grid>之间的所有代码复制到里面就行。

2025-07-14 11:12:02 395

原创 3.1 WPF画折线图、直方图、饼状图

本文看了博客,这里作为笔记用。

2025-07-14 10:29:31 469

原创 4.Stable Diffusion WebUI 模型训练

本文看了知乎的文章,这篇文章写的很详细,可能是我的SDW版本升级了,有的地方和这篇文章的不同,所以内容有部分的改动,但最后还是可以正常训练了,这里作为笔记用。如果要更全面了解Stable Diffusion WebUI 的使用,建议大家看上面那篇知乎的文章,文章写的很全,包括文生图、图生图的细节及模型训练、模型合并的细节,都讲的很详细。

2025-07-01 11:17:39 1156

原创 3.Stable Diffusion WebUI本地部署和实践

本文看了和,本人根据它们部署了一遍,中间遇到一些报错,但根据报错提示解决了问题,最后部署成功,这里主要作为笔记用。

2025-06-27 10:52:21 1061

原创 9.微调训练大模型Qwen2.5-0.5B

本文看了博客,该博客写的很详细,安装该博客操作时在我的电脑上报错时做了细微的代码变化,这里作为笔记用。

2025-06-24 15:06:09 698

原创 8. ollama 常用的Python使用命令

上一节写了ollama本地部署大模型,这里主要写ollama用python调用大模型。这里主要看了博客,这里作为笔记用,以下代码都能在python环境下跑通。

2025-06-19 17:20:37 513

原创 7. Ollama: 大模型本地部署和Python接口

Ollama 是一个开源的大型语言模型(LLM)服务工具,旨在简化在本地机器上部署和运行大型语言模型的过程。本地部署:Ollama 允许用户在本地机器上部署和运行大型语言模型,无需依赖外部服务器或云服务。这使得用户可以在私有环境中使用强大的语言模型功能,保护数据隐私和安全性.简化部署过程:通过提供一键安装和配置的脚本,Ollama 大幅简化了在 Docker 容器中部署大型语言模型的过程。用户只需运行简单的命令,即可快速搭建起模型运行环境,无需手动配置复杂的依赖和参数.

2025-06-18 11:15:06 1205

原创 6.多项式拟合原理

本文的多项式拟合原理看了博客,该博客写的很详细,这里只是作为笔记用。

2025-06-12 14:46:29 1910

原创 5.leecode的回溯算法求解排列组合问题

这些题都可以用回溯算法解决。这里先说回溯算法的框架,然后根据这个框架求解每个问题。

2025-05-10 15:30:53 322

原创 12. RANSAC点云多平面拟合分割

本文看了博客的文章,该博客将多平面拟合分割讲的很详细了,这里只是作为笔记用。

2025-04-28 14:06:55 1295

原创 5.yolov5目标检测的transfomer模型介绍(python)

trunc_normal是截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)。# 1.截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)运行结果如下:显然,该模块建立了一个3X3的tensor张量,且填充的数据符合均值为0,方差为1,最大值为2,最小值为-2的正态分布。

2025-03-26 17:20:26 1151

原创 2.1 transformer模型原理及代码(python)

本文参考了其他一些博客,在这里作了一个汇总,参考最多的是博客、博客和博客,也看了其他博客,在这里不详细的说了,作为笔记用。

2025-03-16 13:06:28 1792

原创 2. qt写带有槽的登录界面(c++)

我们在中写了个简单的登录界面,但没有槽,在这里写一个带有槽的界面。

2025-03-15 13:32:56 603

原创 1.Qt写简单的登录界面(c++)

Qt是我们设计界面最常用的方法,当然,Qt也可以画图等,所以Qt很常用,在这里首先介绍简单的界面设计。其实Qt也有其他语言的,前面我用Qt的designer做过python的简单界面设计,可以看博客4. designer建立关于目标检测的简单界面(python)_qt designer 目标检测-CSDN博客,今天在这里用vs的c++实现Qt的简单界面设计,qt在vs的环境配置可以看我的另一篇博客9.8 Visual Studio 2022安装Qt 和安装graphic-CSDN博客。

2025-03-02 12:47:31 1135

原创 9.8 Visual Studio 2022安装Qt 和安装graphic

点击扩展-QT VS Tools-Qt Versions,然后点击右侧绿色加号,选择QT的安装目录。然后双击这个文件,如果没有注册账户,需要用自己的邮箱注册账户,然后根据提示操作即可。至此,在visual studio 2022中安装QT完毕。再在右边QT右边有个“在浏览器中查看”,打开后出现如下画面。添加完毕之后点击确定,这时候我们重新创建QT项目测试一下。安装之后,进入到vs主界面,我们发现扩展菜单中多了一行。然后双击该文件,依次点击直到安装完成即可。这里作为笔记用,也很重要。单击“下载EasyX”

2025-03-01 12:44:55 1310

原创 1_4.最大括号深度(python)

代码很简单,直接看代码就可以了解思路。数字 8 在嵌套的 3 层括号中。数字 3 在嵌套的 3 层括号中。嵌套深度是嵌套括号的。

2025-02-28 14:47:24 230

原创 1_3. 跳格子2_动态规划(python)

动态规划算法会对每一个子问题只计算一次,然后将其计算结果保存在一个表格中,当再次需要计算已经计算过的子问题时,只是在表格中简单地查看一下结果,从而获得较高的效率。动态规划算法解决了“子问题重叠性质”问题,子问题重叠性质是指在用递归算法自顶向下对问题进行求解时,每次产生的子问题并不总是新问题,有些子问题会被重复计算多次。小明和朋友玩跳格子游戏,有n个连续格子组成的圆圈,每个格子有不同的分数,小朋友可以选择从任意格子起跳,但是不能跳连续的格子,不能回头跳,也不能超过一圈。输出能够得到的最高分,比如:3。

2025-02-23 15:12:10 423

原创 1_2 流浪地球(python)

发动机启动的方式分为“手动启动”和“关联启动”两种方式如果在时刻1一个发动机被启动,下一个时刻 2与之相邻的两个发动机就会被“关联启动”。如果准备启动某个发动机时,它已经被启动了,则什么都不用做。发动机0与发动机 N-1是相邻的。流浪地球计划在赤道上均匀部署了N个转向发动机,按位置顺序编号为0~N-1。N 代表部署发动机的总个数,E 代表计划手动启动的发动机总个数。T 代表发动机的手动启动时刻,P 代表此发动机的位置编号。的思路,代码也是,这里作为笔记用。N 代表最后被启动的发动机个数。

2025-02-23 14:32:08 432

原创 9.回文数(python)

将输入转换为字符串,然后比较字符串的前半部分与后半部分反转,若相同,则返回true,否则返回false.从左向右读, 为 -121。从右向左读, 为 121-。因此它不是一个回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。从右向左读, 为 01。因此它不是一个回文数。是一个回文整数,返回。

2025-02-22 17:22:20 320

原创 4. designer建立关于目标检测的简单界面(python)

首先建立的界面效果如下:以上界面中,检测图1是yolov8模型检测得到的图片显示,检测图2是deeplabv3模型检测处理后得到的图片;下面检测数量是两个模型分别检测到的目标数量(图片中人的个数);右上角的相同是指两个模型的检测数量是否相同,若相同则显示"true",否则显示“false”。下面简单介绍该功能实现的步骤。

2025-02-22 16:17:48 1323

原创 7.整数反转

思路:1.先将整数转换为字符串,再反转字符串,循环字符串的第一位,若第一位是“0”时则裁剪掉,直到第一位不是0为止。3.整数为负值时,对其绝对值做步骤1的操作,最后转回整数后乘以-1即可。2.绝对值小于10的整数返回整数本身。如果反转后整数超过 32 位的有符号整数的范围。给你一个 32 位的有符号整数。中的数字部分反转后的结果。外的整数单独返回为0.

2025-02-21 15:11:46 507 1

原创 6.z字形变换(python)

如3行时,我们建立一个数组res,数组包含3个“”元素,则在遍历s = "PAYPALISHIRING"的过程中,对res根据index依次由前到后和由后到前的加入s的元素,最后再把res的各元素拼接即可。,以从上往下、从左到右进行 Z 字形排列。

2025-02-21 14:25:04 569 1

原创 5.最长回文字(python)

结合代码看解题思路,代码已经注明解题思路。"aba" 同样是符合题意的答案。中最长的 回文 子串。

2025-02-20 17:38:38 298

原创 3.1 actor基本框架(c#的Akka.Actor模式)

Actor A:完成任务后发送消息给Actor B。Actor B:接收到消息后执行自己的任务。// Actor A// 模拟任务完成// 模拟耗时操作// 通知 Actor B});// Actor B// 模拟任务完成// 模拟耗时操作});//创建 ActorSystem// 创建 Actor B// 创建 Actor A,并传入 Actor B 的引用// 触发 Actor A 开始工作。

2025-02-20 15:20:52 612

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除