yimi~-CSDN博客

原创这可能是全网唯一你能找到的关于Qwen-Agent框架中关于RAG的代码解读

本文分析了qwen-agent的RAG实现方案，指出其存在无法实时更新知识库、缺少Embedding处理等不足。文章通过代码解析，展示了RAG的核心流程：从Assistant类触发文档解析，通过Memory类管理文件处理，最终调用retrieval工具进行内容检索。主要涉及的文件包括memory.py、retrieval.py等，其中Memory类负责初始化RAG配置并协调各工具协同工作。当前实现将文档分块后直接存储为字符串，缺乏向量化处理环节，且每次更新知识库需重启agent。

2025-06-10 14:39:47 1589 1

原创 Small UAV Image Registration Dataset (SUIRD) 数据集介绍，这可能是全网唯一你能找到的介绍了

最近在研究遥感特征匹配的工作，阅读了一些这个领域的论文，其中有一篇论文介绍到了SUIRD数据集。这是一个很小的数据集，包含60个图像对，虽然readme里有对mat文件中字段的介绍，但是其中还有两个干扰字段没有说明，一度让我误解了其代表的含义，这两个字段分别为finematch和loosematch。这两个字段本身没有任何含义，忽略掉就好，并且也用不到。下面介绍剩下字段的含义。小型无人机图像配准数据集（SUIRD）是一个用于图像配准/匹配研究的公共数据集。

2025-03-20 16:05:01 754 1

原创 Sparse Large Kernel Network - SLaK训练，没错这就是全网你唯一能找到的教程！

由于ViTs的出现将原来的视觉任务的准确率几乎都刷了一遍，于是便有人着手去研究为什么ViTs的效果会这么好。他们得到的其中一个结论是，ViTs可以建立长程依赖，换句话说就是ViTs拥有更大的核（kernel），对应ViTs中便是的window_size。因此有研究尝试使用更大的卷积核来替换传统的3×33\times 33×3卷积核，经过实验，发现这样做可以提升CNN的性能，并能够和ViTs相媲美。

2024-09-23 16:53:10 1252 1

原创用自己的数据训练LoFTR，这可能是全网你唯一能找到的教程了

使用自己的数据训练LoFTR，全网独一份教程

2024-09-06 15:12:26 3725 20

原创 LoFTR自己动手训练，这可能是全网你能找到唯一的训练教程了

最近在研究LoFTR，一种基于Transformer的特征点提取和匹配方法，运行了Demo在给定的测试集上效果很好，但是我发现这些数据都存在一个明显的特点，即匹配的对象都是针对同一个物体进行的特征提取和匹配，而我想将这种方法应用于无人机摄影测量，不清楚LoFTR在连续图像之间的匹配情况如何，不过感觉应该可行，需要修改一下预测的pipeline。

2024-09-03 12:59:10 9741 64

原创 VastGaussian复现，这可能是全网你唯一能够找到的代码了

这是的非官方实现，因为是第一次从头复现完整的代码，因此代码可能会出现一些错误，并且代码的写法和一些高手相比可能会显得有些幼稚，缺少一些工程上的技巧。不过我也迈出了自己的第一步，因为我在网络上找不到任何关于VastGaussian的任何实现，于是我进行了一下尝试。

2024-05-21 14:20:26 2656 26

原创计算机视觉之三维重建, 写给所有试图研究三维重建的初学者

网络上关于三维重建的相关博客有很多,但是我觉得那些大都不适合初学者进行学习,往往是直接讲解某个知识点,当我们对于前面的支撑知识不够了解的话,看起来可能是相当费劲的(我就是刚入门的菜鸡). 因此我在B站上找到了一门非常好的课程, 学完之后对笔记进行了整理, 这门课讲的非常易懂, 同时也补充了计算机视觉的相关基础知识. 强烈建议初学者都学一学, 非常好的课程!欢迎从事三维重建的小伙伴找我交流:QQ: 37477422VX: k374774222

2024-03-11 14:07:37 1967 3

原创使用CLion进行cuda编程，并使用cuda-gdb对核函数进行debug，这可能是全网你能够找到的最详细的CLion和cuda编程环境配置教程了

在确定了研究方向后，便开始着手研究相关的文献和Code，指导我看到了3D Gaussian Splatting。以往的DL工作的代码几乎都只建立在Python语言基础上，如果只是Python到还好，勉强还能看懂，但对于CUDA部分的C++代码，那是真看不懂了。而3DGS正是我接触CUDA编程的契机，使得我开始注重自己的全面发展，不想仅仅做一个DL农工，还需要研究一些更深入的东西，因此学习CUDA编程是有必要，而且学习CUDA编程也不亏，顺便把C++的知识也一并不上了。

2023-12-11 14:29:16 6323 6

原创 Could not build wheels for srtm4, which is required to install pyproject.toml-based projects

配置SatNerf的环境时，需要安装srtm4包，但始终装不上。

2023-11-20 17:40:57 1992

原创 Pytorch CUDA CPP简易教程，在Windows上操作，Linux上同理

这学期确定了研究方法，具体为三维重建相关，转而研究三维重建相关的知识。最近3D Gaussian Splatting方法效果十分的好，并且开源了源代码，因此十分值得对其源码进行研究，源码中对于可微光栅化的实现是基于CUDA实现的，因此想要后续对这块内容进行改进，则必须了解CUDA程序是如何编写的，作为一名DL农工，学习CUDA编程也有助于自己对于整个DL流程的理解，也能够进一步拓展自己的编程技术，因此无论出于什么目的，作为DL农工，我认为有必要掌握这项技术。

2023-11-14 19:53:21 1208 2

原创 CLion配置libtorch找不到xxx.dll

使用CLion配置libtorch时遇到该问题。

2023-11-10 10:56:47 712

原创 warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失

在使用CLion编写C语言代码时出现该问题。

2023-11-02 13:44:24 1747

原创 latent-diffusion model环境配置，这可能是你能够找到的最细的博客了

最近在研究diffusion模型，并对目前最火的stable-diffusion模型很感兴趣，又因为stable-diffusion是一种latent-diffusion模型，故尝试复现latent-diffusion model，并训练自己的LDM。写这篇博客的出发点是因为，当我跟随github页面上的install教程进行安装的时候，遇到了很多问题，有些是因为网络问题，服务器无法直接下载国外服务器的资源；有些则是软件版本其实是错的，照着安装就是不对。

2023-06-19 13:19:40 18756 140

原创使用Supermap iobject python和Supermap iServer REST API发布地图服务，你能找到全国目前唯一iobjectpy用法，国产软件生态还是不好哇

最近帮助老师干活，进行WebGis的开发，老师要求用国产软件SuperMap，从此开始了一段长达两周的踩坑。至此，使用SuperMap iServer自动发布地图服务的流程全部结束，在此期间我把能查的资料几乎全看了一遍，这些资料几乎全都写的非常简单，甚至没有，真的是一点点摸索出来的，刚从一个坑跳出来，紧接着又跳进下一个坑里。SuperMap的资料太少了，官方文档写的也很简单，不过还好的是SuperMap官方论坛很活跃，他们的技术人员回复很快的。

2023-06-05 15:53:12 2503 4

原创使用A100 GPU搭建OBBDetection的运行环境

最近需要复现一篇目标检测论文的代码，文章提供了代码，因此自己根据仓库的说明尝试配置环境运行代码，但遇到了非常多的困难。

2023-05-18 15:39:10 1477 3

原创 Typora使用PiCGo-Core将图片上传至阿里云OSS

typora使用picgo-core将图片上传至阿里云OSS

2022-07-06 14:25:50 1081

原创关于pytorch中drop_last的提醒，不同类别数据不均衡时使用drop_last=True会导致模型训练结果很差

项目场景：我在使用pytorch进行图像分类的时候。我的解决办法对于我而言很有效，你可以把我的结论当作一种参考问题描述遇到了这样的问题。一共16类，第15 16类的训练集数量是15、15，测试集分别为14、5。其他1-14类训练集分别有50个，测试集均为200左右。当我在pytorch的dataloader中设置了drop_last=True时，无论怎么训练，使用怎么样的数据增强，第15 16类才测试集上的准确率永远为0.原因分析：当dataloader设置了drop_last=True时

2022-04-01 12:39:53 9942 3

原创我的深度学习过程，你可以借鉴我的方法，该方法对初学者友好

Beginner-friendly Deep Learning Process1.观看李飞飞和吴恩达的机器学习系列课程斯坦福李飞飞CS231n计算机视觉课程吴恩达机器学习系列课程2.Pytorch入门课程Pytorch 入门到精通全教程-卷积神经网络-循环神经网络我的GitHub仓库3.李宏毅的课程最实用-宝可梦王子李宏毅2021春季课程4.Pytorch实战课程Pytorch深度学习实战教学我的GitHub仓库5.时刻关注新的技术多实战和多复现代码你可以通过B站UP学习DL最新相关论文以及技术多进行实战

2022-03-16 14:15:31 3895 3

原创使用PicGo-Core将Github作为Typora的图床

1.在Github上建立存储图片的仓库![在这里插入图片描述](https://img-blog.csdnimg.cn/img_convert/439bbed121ececb0ec89833d9cbba756.png#pic_center2.在Github中授权Token点击开发者设置注意：申请的Token只会显示一次，当你第二次在打开该页面时就无法看到该Token了。如果忘记了Token，唯一的办法就是重新生成一个3.打开Typora的偏好设置下载PicGo-Core，不建议使用P

2021-10-23 19:04:12 470

原创 AttributeError: Can‘t get attribute ‘xxx‘ on ＜module ‘main‘ from ‘xxx‘

AttributeError: Can’t get attribute ‘xxx’ on <module ‘main’ from ‘xxx’ 另一种可能的解决办法问题重述：我在学习pytorch时，跟着网课学到使用pickle模块序列化Word2Seq类，并将该类序列化保存在ws.pkl文件中。然后我又创建了lib.py文件使用下面代码反序列化ws.pkl时出现了该问题。 ws = pickle.load(open('ws.pkl', 'rb')) 先说明第一种解决办法（该方法并不总是有效）：

2021-09-25 18:45:02 18607 5

原创使用pdfkit无法导出html中本地图片的问题解决

pdfkit- Warning: Blocked access to file 解决# 使用pdfkit时可以配置上下面options中的信息# <img src='xxx.jpg> 标签中的本地图片即可被正确导出options = { "enable-local-file-access": None}pdfkit.from_file(html_file_name, pdf_file_name, options=options)...

2021-09-08 11:24:56 996

原创 Django1.0 UnicodeDecodeError: ‘gbk‘ codec can‘t decode bytes in position 1639-1640

UnicodeDecodeError: ‘gbk’ codec can’t decode bytes in position 1639-1640: illegal multibyte sequence 可能的解决办法报错内容：报错位置：可能的解决办法：借鉴该文章方法代码修改：

2021-08-25 11:30:57 122

原创 ValueError: Dimension 0 in both shapes must be equal, but are 1 and 60. Shapes are [1,1,512,40]可能的解法

ValueError: Dimension 0 in both shapes must be equal, but are 1 and 60. Shapes are [1,1,512,40] and [60,512,1,1]. for ‘Assign_55’ (op: ‘Assign’) with input shapes: [1,1,512,40], [60,512,1,1].在网上查到遇到这个问题时大都说的是路径问题，但其实还有一个原因是，你使用的yolov3是tiny版本，导致框的个数和yolov3

2021-06-04 21:47:33 1145 2

qq_42940160的博客