自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

原创 模型训练与验证minicpm-v

训练使用混合数据集进行训练,对minicpm-V进行lora微调,微调后使用llama3_1对输出结果与标签值进行比对,计算准确率。

2024-08-14 20:20:03 299 1

原创 混合数据集训练

多模态模型进行训练时,通常需要混合其他数据,以避免训练过程中对其他知识能力表现的降低。

2024-08-13 17:26:20 269

原创 json画图函数

【代码】json画图函数。

2024-08-13 15:05:43 195

原创 使用 swift 微调minicpm

调试代码使用debugpy配置launch.json文件进行调试,当代码中使用如下方法时,并不生效,会出现oom的问题。运行代码使用环境变量进行运行。

2024-07-29 10:09:48 281

原创 neo4j docker安装(windows 系统)

没有使用官方提供的neo4j镜像进行安装,而是在pytorch容器中安装neo4j,安装的思路与在linux环境中安装neo4j的方法相同,这里对官方的教程进行简单的概述。由于需要使用graghrag进行知识图谱的建立,并对齐进行可视化,因此采用neo4j的软件进行可视化。根据官方脚本进行安装,安装完成后配置docker,可以实现本地的浏览器对数据库的访问。. neo4j 安装插件APOC,插件对应的版本号与neo4j的版本号相同。graghrag的可视化代码可以参考。系统:win11,基于wsl。

2024-07-26 16:39:45 379

原创 利用chatgpt实现数据集转换

使用minicpm进行多模态数据集的微调时,混合不同类型的外部数据,并增加自己专有数据集。由于原始数据集格式与minicpm数据集格式具有偏差,因此进行转换,使用chatgpt自动化的处理。

2024-07-23 18:19:31 191

原创 Minicpm-V代码微调

minicpm-V 微调参数设置

2024-07-16 16:15:21 404

原创 depth anything v2 vscode 调试

实现对depth anything v2 训练代码的vscode ide 调试

2024-07-05 10:10:56 231

原创 众星捧月算法比赛-知识工程-简单实现

参考比赛官网:https://be-loved.cn/zte-student-match/main/zsgc通过HuggingFaceLLM 和llamaindex实现了LLM+RAG的基本流程,但是模型的算法结果并不好,需要调优处理。

2024-06-17 20:41:09 479 1

原创 使用vscode的tunnel实现远程调试

使用以上的教程可以实现对linux服务器端的基本设置,但是使用github账号进行登录时可能出现超时的情况,因此可以使用微软账号进行登录,使用微软账号登录后结果如下所示。由于服务器使用内网进行连接,远程连接调试带来困难,因此采用vscode CLI进行隧穿实现远程调试。这样刷新后,就会在tunnel出现对应的远程连接。第一次安装需要下载一些插件,因此相应速度比较慢。同时需要对远程连接插件进行信任设置,设置方法如图所示。

2024-06-14 19:35:39 502

原创 在windows系统中运行opencalib实现激光雷达和相机的联合标定

通过容器实现在windows系统中激光雷达和相机外参的标定

2024-06-13 20:14:46 502

原创 halcon 位姿估计代码

基于形状匹配的位姿估计代码,将位姿以文本形式进行保存。队原始的图像进行了处理,去除纹理信息,保存关键边缘信息。

2024-05-15 15:38:41 322

原创 位姿估计代码与工具

在进行位姿估计过程中,通常使用一些可视化方法对结果进行可视化。

2024-05-15 14:52:01 311

原创 在掩码区域内填充圆形

填充掩码

2024-05-15 14:41:14 277 1

原创 通过open3d可视化相机视锥

进行物体的位姿估计或者3维重建过程中通常需要对相机的位置进行可视化,我们为了实现物体的模型和相机的位置同时显示吗,因此使用open3d进行可视化。其中位姿是通过halcon进行获得的,保存在txt文件中,相机的内参是realsense自标定的结果。

2024-03-27 23:01:02 1008 1

原创 通过物体的位置进行物体位姿掩码的自动标注

我们参考DEEPMIND提供的标注工具,通过SAM构建了半自动化的标注工具,但是对我们的数据集来说,分割的结果并不好,但是我们场景中的物体具有CAD模型这个先验的条件,如果没有CAD模型可以使用3D重建方法进行重建,例如colmap方法获取物体的3D模型和相机的位姿值,是一个可行的方法。我们使用的方法是通过HALCON进行获取相机的位姿值,通过CAD模型转换为mesh,通过trimesh进行渲染得到,我们的代码来自物体六自由度位姿估计方法的数据集构造方法库。

2024-03-17 19:14:27 351 2

原创 类别级物体位姿估计综述

类别级物体位姿估计综述

2024-03-06 11:35:08 170

原创 pytorch3d 安装

记录一下 ,使用以下命令安装过程中出现错误,因此使用如下命令进行安装,

2024-02-06 17:53:32 1716 1

原创 RenderNet模型复现

没有使用z特征向量,z特征向量的解释可以参考论文Category Level Object Pose Estimation via Neural Analysis-by-Synthesis了解其具体含义,这里被定义为物体的外观特征。模型直接输入物体的体素,通过位姿控制生成对应的轮廓,其中数据集采用blender生成的轮廓。

2024-02-01 15:56:09 284 1

原创 批量处理png为eps

由于不会使用windows的.bat文件对图像进行批量的处理,因此使用python调用windows的命令行实现批量的处理。使用python调用windows也是一个很好的变通方式。

2024-01-21 22:16:30 460 1

原创 blender实现物体的外轮廓渲染

对合成物体进行轮廓的提取,提取的轮廓可用于深度学习中的边缘的提取模型,但是没有办法实现对遮挡的表明。同时物体的轮廓包含了物体的几何信息,几何信息可以用于位姿的估计。通过自动化的脚本获取具有遮挡关系的外轮廓图像。外轮廓图像通过脚本文件中的进行渲染得到。关于使用脚本文件进行渲染的详细操作可以参考。通过线稿的获取进行获得。同时blender通过添加物体的修改器中的线框图实现物体更加精细化的线框图获取。

2023-11-18 23:14:22 587 1

原创 通过blender的进行球表面的细分 三角划分 均匀的视角分布

对球面进行细分实现相机的采样,采样点尽量的均匀。

2023-11-11 17:28:11 249 1

原创 博客摘录「 在linux里面把一个在前台运行的命令转为后台运行」2023年11月6日

linux操作系统 可以通过使用 Ctrl + Z 快捷键将一个正在前台运行的命令暂停,并使其转为后台运行。然后,可以使用 bg 命令将它转移到后台。

2023-11-06 18:27:57 118 1

原创 对文件夹的图像按照文件名序号进行排序读取

由于一个病人在进行CT扫描时,将切片图像按照扫描的顺序(文件名为扫描的顺序数字)进行保存,但是进行文件读取时顺序可能会发生改变,因此读取图像时,发生时序信息发生改变,造成信息的错误,因此使用文件名的顺序是非常有必要的。以下是一个代码实例,将图像的名进行保存和对应的图像信息,使用python的lamda函数进行排序,实现按照顺序进行读取的方法。

2023-09-24 11:34:51 239 1

原创 #每日挑战 岛屿的最大面积

使用广度优先算法实现图的搜索,使用队列将图的节点(在本题中主要是节点的位置进行储存)进行储存,使用一个二维的vector对节点的状态进行储存(是否遍历过,假如比遍历过就将节点状态变为0,这样就不会重复相加)。以下代码是剑指offer代码的c++版本。代码关键点同样包括使用一个循环对四个相邻节点都进行遍历。dirs相当于定义了节点相邻的四个方向,遍历节点运动的方向也就是对四个相邻节点的遍历。

2023-09-18 12:29:18 31

原创 # leetcode每日挑战392

判断子序列 c++ 实现

2023-09-14 14:46:48 61

转载 球面細分方法记录

由于相机位置需要在球面上进行生成,因此需要对球面进行细分,并将位置进行保存。保存之后使用lookat函数获得最终的旋转角度。对球面进行三角细分,球面被分成三角形,使用多次细分的方法实现。在上述构造的20面体的基础上实现 细分。利用生成的20面体实现细分。

2023-04-15 15:10:04 161

原创 Kinect2点云配准

通过遍历的方式实现。数据类型的含义和具体转换方式可通过链接查看OpenCV中Mat数据类型及相互转换使用imshow进行显示图像时,需要将像素值映射到[0,255],不同数据类型显示时需要进行转换。在进行kinect2相机实现点云的配准过程中,使用opencv创建了Mat类型的数据,mat类型数据创建过程中,Mat i_depthToRgb(424, 512, CV_8UC4);需要指定图像的宽(512)和高(424),同时还需要指定数据类型,本例中指定的数据类型为CV_8UC4。

2023-03-24 01:06:09 583

原创 使用c++实现循环链表

尾插法方法,实现链表的建立。使用快慢指针的方法实现入口节点的查找,使用先查找循环链表中节点的数量,再次使用快慢指针实现入口节点的查找。建立循环链表,选择一个节点作为节点的入口。使用结构体建立链表,使用尾插法实现循环链表的建立。

2023-02-21 21:14:12 141 1

原创 leetcode 面试题21 使用c++实现

将剑指offer中的java代码改写为c++,使用双指针实现,并使用哨兵节点减少条件判断,实现删除链表表头。

2023-01-08 12:18:28 130

原创 C++通过循环建立链表

使用c++实现链表的建立,创建一个链表节点的结构体。通过循环 遍历链表,当链表为空时返回0。通过循环建立简单的链表。

2023-01-07 23:30:13 380

原创 剑指offer14

与Java程序相比较,c++程序主要使用new建立动态数组实现哈希表的构建。使用双指针的方式实现字符串中变位词的查找。使用c++进行动态数组建立的过程中,为获取动态数组的长度。可以使用_msize获取指针所占内存的字节数,再除以第一个元素所占的字节数,即为数组的长度。

2023-01-03 16:34:59 62

原创 点云处理过程中.stl文件转为.ply文件

在进行点云的处理过程中需要进行文件的转换,可以使用open3d软件包进行转换,由于.ply文件有两种储存方法,为了便于VScode进行读取查看可以使用ASCII方式进行储存,而不是用二进制的形式。.ply文件可以使用blender进行打开或使用windows自带的画图3D进行打开。同时stl文件也可以通过blender文件进行导入,再次使用blender导出后缀为ply的文件。

2022-11-05 17:25:03 1748

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除