- 博客(188)
- 收藏
- 关注
原创 7.bundlesdf本地安装
永久设置环境变量(可选,避免每次重启终端失效)下载好4.11.0.zip文件后,解压源码。1,opencv4.11.0安装。
2026-05-30 16:51:01
59
原创 7.Gemini相机+yoloseg+foundationpose环境搭建及应用
系统:ubuntu22.04 ROS2由于ros2环境是自带的python10,而foundationpose环境是python11,所以该demo用两个环境实现功能,ros2负责获取相机参数以及分割目标物体,foundationpose接收数据后获取目标物体的位姿态,中间由socket进行发送信息和接收信息。
2026-05-28 11:24:40
246
原创 6. Gemini相机+yoloseg+foundationpose环境搭建及应用
1.获取相机的数据,然后通过相机内参将像素坐标转换为相机坐标;3.把深度图的深度值和分割的彩图值结合构成3维数据;4.foundationpose对3维数据找位姿。2.yolov8的分割模型获取抓取物体的烟码;1.2 foundationpose环境搭建。系统:ubuntu22.04 ROS2。1.1 分割环境和open3d环境的搭建。项目用conda搭建环境。
2026-05-22 09:34:03
221
原创 3.gemini336相机在ubuntu22.04的ros2下运行
若ros2 pkg list | grep orbbec命令后有orbbec_camera、orbbec_camera_msgs、orbbec_description,则这个命令的验证成功,如果空白,没有这些的输出,则编译失败,有可能是ros2的。已经被打包进 Ubuntu 的 ROS 2 软件源里了,直接一条命令就能安装,完全不用下载源码)5.安装 udev 规则(源码版专用脚本)安装完成后,直接重新编译Orbbec 包(1.创建 ROS2 工作空间。
2026-04-27 11:36:33
487
原创 15.Slam算法的环境搭建与测试
环境搭建核心:虚拟机重点要分配足够的内存 / CPU,更换国内源解决下载慢,rosdepc 替代 rosdep 解决初始化失败;使用核心:虚拟机只能跑离线数据集(TUM/EuRoC),验证 SLAM 算法的建图 / 定位逻辑,熟悉参数调整;进阶方向:等熟悉基础后,装双系统(物理机 Ubuntu),连接摄像头 / 激光雷达跑实时 SLAM。如果运行过程中遇到具体报错(比如编译失败、数据集跑不起来),可以把报错信息发给我,我帮你定位解决。
2026-01-18 10:17:34
799
原创 14.1 人脸的三维重构(PRNet算法)
我们在写了colmap的三维重构的环境搭建与使用,该算法可以重构任意的物体,但对拍照要求比较高,本文介绍的PRNet算法专门用来三维重构人脸,并且单张图片就可以重构。
2025-12-24 14:31:35
385
原创 13.长视频和短视频的目标追踪(yolo_insightface模型)
在视频中提取出了5个id,而视频中实际上只有这5个人,我另外运行了3个视频,最后追踪的结果没有重复的头像,也没有漏掉的头像。运行时间和图片中的人头个数成正比,insightface检测每个头像的时间约为0.08s~0.2s之间。(Anaconda/Miniconda)创建独立环境,也可使用。在2.1搭建环境里运行以下代码即可。InsightFace 依赖。
2025-12-16 14:32:11
560
原创 12.rf-detr目标检测模型的环境搭建、数据集制作、模型训练和预测
这是测试结果,3个类的置信度都大于0.9,我用yolov8以相同的数据集训练模型,测试的置信度都小于0.8,可见该模型的效果更好,但该模型的pth文件500M左右,而yolo模型的pth文件只有6M左右。上面图片是images和labels文件夹,分别放图片和标签,最下面的txt文件里面是标签的所有类别,类别的存放方式如上图中打开的txt文件,这个文件有3个类别。,然后下拉页面,可以看到如下图的一个.zip文件的源代码下载,点击后得到一个zip的压缩文件,并解压zip文件。至此,模型训练完成。
2025-11-28 16:01:38
675
原创 11.2 yolov8用自己的数据集训练语义分割模型
本文看了博客和博客,将两个博客的内容串着操作了一遍,这里作为笔记用。1.下载下载后打开labelme.exe文件得到如下图:2.新建label保存标签上图中,images是图片的文件夹,json文件是标注后存放json文件的文件夹,然后打开数据集文件进行标注。
2025-07-24 16:39:08
973
原创 4.Stable Diffusion WebUI 模型训练
本文看了知乎的文章,这篇文章写的很详细,可能是我的SDW版本升级了,有的地方和这篇文章的不同,所以内容有部分的改动,但最后还是可以正常训练了,这里作为笔记用。如果要更全面了解Stable Diffusion WebUI 的使用,建议大家看上面那篇知乎的文章,文章写的很全,包括文生图、图生图的细节及模型训练、模型合并的细节,都讲的很详细。
2025-07-01 11:17:39
1156
原创 3.Stable Diffusion WebUI本地部署和实践
本文看了和,本人根据它们部署了一遍,中间遇到一些报错,但根据报错提示解决了问题,最后部署成功,这里主要作为笔记用。
2025-06-27 10:52:21
1061
原创 9.微调训练大模型Qwen2.5-0.5B
本文看了博客,该博客写的很详细,安装该博客操作时在我的电脑上报错时做了细微的代码变化,这里作为笔记用。
2025-06-24 15:06:09
698
原创 8. ollama 常用的Python使用命令
上一节写了ollama本地部署大模型,这里主要写ollama用python调用大模型。这里主要看了博客,这里作为笔记用,以下代码都能在python环境下跑通。
2025-06-19 17:20:37
513
原创 7. Ollama: 大模型本地部署和Python接口
Ollama 是一个开源的大型语言模型(LLM)服务工具,旨在简化在本地机器上部署和运行大型语言模型的过程。本地部署:Ollama 允许用户在本地机器上部署和运行大型语言模型,无需依赖外部服务器或云服务。这使得用户可以在私有环境中使用强大的语言模型功能,保护数据隐私和安全性.简化部署过程:通过提供一键安装和配置的脚本,Ollama 大幅简化了在 Docker 容器中部署大型语言模型的过程。用户只需运行简单的命令,即可快速搭建起模型运行环境,无需手动配置复杂的依赖和参数.
2025-06-18 11:15:06
1205
原创 5.yolov5目标检测的transfomer模型介绍(python)
trunc_normal是截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)。# 1.截断正态分布,用来初始化权重张量(用截断正态分布填充张量,a是下限,b是上限,mean是均值,正态分布的标准差,tensor要初始化的张量)运行结果如下:显然,该模块建立了一个3X3的tensor张量,且填充的数据符合均值为0,方差为1,最大值为2,最小值为-2的正态分布。
2025-03-26 17:20:26
1151
原创 2.1 transformer模型原理及代码(python)
本文参考了其他一些博客,在这里作了一个汇总,参考最多的是博客、博客和博客,也看了其他博客,在这里不详细的说了,作为笔记用。
2025-03-16 13:06:28
1792
原创 1.Qt写简单的登录界面(c++)
Qt是我们设计界面最常用的方法,当然,Qt也可以画图等,所以Qt很常用,在这里首先介绍简单的界面设计。其实Qt也有其他语言的,前面我用Qt的designer做过python的简单界面设计,可以看博客4. designer建立关于目标检测的简单界面(python)_qt designer 目标检测-CSDN博客,今天在这里用vs的c++实现Qt的简单界面设计,qt在vs的环境配置可以看我的另一篇博客9.8 Visual Studio 2022安装Qt 和安装graphic-CSDN博客。
2025-03-02 12:47:31
1135
原创 9.8 Visual Studio 2022安装Qt 和安装graphic
点击扩展-QT VS Tools-Qt Versions,然后点击右侧绿色加号,选择QT的安装目录。然后双击这个文件,如果没有注册账户,需要用自己的邮箱注册账户,然后根据提示操作即可。至此,在visual studio 2022中安装QT完毕。再在右边QT右边有个“在浏览器中查看”,打开后出现如下画面。添加完毕之后点击确定,这时候我们重新创建QT项目测试一下。安装之后,进入到vs主界面,我们发现扩展菜单中多了一行。然后双击该文件,依次点击直到安装完成即可。这里作为笔记用,也很重要。单击“下载EasyX”
2025-03-01 12:44:55
1310
原创 1_4.最大括号深度(python)
代码很简单,直接看代码就可以了解思路。数字 8 在嵌套的 3 层括号中。数字 3 在嵌套的 3 层括号中。嵌套深度是嵌套括号的。
2025-02-28 14:47:24
230
原创 1_3. 跳格子2_动态规划(python)
动态规划算法会对每一个子问题只计算一次,然后将其计算结果保存在一个表格中,当再次需要计算已经计算过的子问题时,只是在表格中简单地查看一下结果,从而获得较高的效率。动态规划算法解决了“子问题重叠性质”问题,子问题重叠性质是指在用递归算法自顶向下对问题进行求解时,每次产生的子问题并不总是新问题,有些子问题会被重复计算多次。小明和朋友玩跳格子游戏,有n个连续格子组成的圆圈,每个格子有不同的分数,小朋友可以选择从任意格子起跳,但是不能跳连续的格子,不能回头跳,也不能超过一圈。输出能够得到的最高分,比如:3。
2025-02-23 15:12:10
423
原创 1_2 流浪地球(python)
发动机启动的方式分为“手动启动”和“关联启动”两种方式如果在时刻1一个发动机被启动,下一个时刻 2与之相邻的两个发动机就会被“关联启动”。如果准备启动某个发动机时,它已经被启动了,则什么都不用做。发动机0与发动机 N-1是相邻的。流浪地球计划在赤道上均匀部署了N个转向发动机,按位置顺序编号为0~N-1。N 代表部署发动机的总个数,E 代表计划手动启动的发动机总个数。T 代表发动机的手动启动时刻,P 代表此发动机的位置编号。的思路,代码也是,这里作为笔记用。N 代表最后被启动的发动机个数。
2025-02-23 14:32:08
432
原创 9.回文数(python)
将输入转换为字符串,然后比较字符串的前半部分与后半部分反转,若相同,则返回true,否则返回false.从左向右读, 为 -121。从右向左读, 为 121-。因此它不是一个回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。从右向左读, 为 01。因此它不是一个回文数。是一个回文整数,返回。
2025-02-22 17:22:20
320
原创 4. designer建立关于目标检测的简单界面(python)
首先建立的界面效果如下:以上界面中,检测图1是yolov8模型检测得到的图片显示,检测图2是deeplabv3模型检测处理后得到的图片;下面检测数量是两个模型分别检测到的目标数量(图片中人的个数);右上角的相同是指两个模型的检测数量是否相同,若相同则显示"true",否则显示“false”。下面简单介绍该功能实现的步骤。
2025-02-22 16:17:48
1323
原创 7.整数反转
思路:1.先将整数转换为字符串,再反转字符串,循环字符串的第一位,若第一位是“0”时则裁剪掉,直到第一位不是0为止。3.整数为负值时,对其绝对值做步骤1的操作,最后转回整数后乘以-1即可。2.绝对值小于10的整数返回整数本身。如果反转后整数超过 32 位的有符号整数的范围。给你一个 32 位的有符号整数。中的数字部分反转后的结果。外的整数单独返回为0.
2025-02-21 15:11:46
507
1
原创 6.z字形变换(python)
如3行时,我们建立一个数组res,数组包含3个“”元素,则在遍历s = "PAYPALISHIRING"的过程中,对res根据index依次由前到后和由后到前的加入s的元素,最后再把res的各元素拼接即可。,以从上往下、从左到右进行 Z 字形排列。
2025-02-21 14:25:04
569
1
原创 3.1 actor基本框架(c#的Akka.Actor模式)
Actor A:完成任务后发送消息给Actor B。Actor B:接收到消息后执行自己的任务。// Actor A// 模拟任务完成// 模拟耗时操作// 通知 Actor B});// Actor B// 模拟任务完成// 模拟耗时操作});//创建 ActorSystem// 创建 Actor B// 创建 Actor A,并传入 Actor B 的引用// 触发 Actor A 开始工作。
2025-02-20 15:20:52
612
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅