leo0308-CSDN博客

原创模型上下文协议(MCP)实践指南

本文介绍了Model Context Protocol (MCP) Python SDK的安装和使用过程。首先需要通过pip install "mcp[cli]"安装MCP，要求Python版本大于3.10。运行测试demo时可能遇到"npx not found"错误，需安装Node.js和npm。在Ubuntu系统中可使用sudo apt install nodejs npm安装依赖，但会连带安装大量其他组件。安装完成后还需自动安装@modelcontextprot

2025-06-10 20:29:53 722

原创大模型编程助手-cursor

官网：

2025-06-06 20:02:15 69

原创大模型编程助手-Cline

Cline 是一款深度集成在 Visual Studio Code（VSCode）中的开源 AI 编程助手插件，旨在通过结合大语言模型（如 Claude 3.5 Sonnet、DeepSeek V3、Google Gemini 等）和工具链，为开发者提供自动化任务执行、智能代码生成、错误修复等功能，显著提升开发效率。

2025-06-06 20:00:53 228

原创 cursor和windsurf使用体验对比

比如，我有一个纯函数的python代码文件，想重构成一个类的形式。cursor会直接把所有方法都写成静态方法，一些公用参数也不会抽出来。windsurf会写成普通类方法，并抽出一些公用参数放在__init__中。1 交互不太友好，对当前选中的代码经常搞错。比如，不知道当前打开的代码文件，光标停留或选中的代码片段无法直接交互。而windsurf 能知道当前的代码文件，可以基于光标停留的位置或选中的代码片段进行交互。3 模型的选择不够多。windsurf可以自由选择模型，还有很多免费的。

2025-06-06 16:26:25 585

原创大模型编程助手-windsurf

可以选择不同的模型，有些模型是免费的，有些是要花积分的。比如GPT-4.1(promo)需要0.25积分， deepseek就是免费的。积分是按次收的，无论问题复杂度如何。2 在pycharm中通过插件使用。1 使用windsurf的IDE。

2025-06-06 15:26:51 230

原创模型上下文协议(MCP)

参考：https://zhuanlan.zhihu.com/p/27327515233

2025-06-06 10:45:12 85

原创 torch.distributed.launch 、 torchrun 和 torch.distributed.run 无法与 nohup 兼容

报错的原因可能是torch.distributed.launch 、 torchrun 和 torch.distributed.run 无法与 nohup 兼容，当ssh连接断开，窗口被关闭时，torch.distribute 接管了相关异常，导致nohup没起作用。

2025-06-03 11:17:48 550

原创推荐一款代码阅读神器-deepwiki

DeepWiki是由Cognition AI（Cognition Labs）基于其明星产品Devin（全球首个AI软件工程师）开发的一款开源工具，旨在通过AI技术为GitHub代码仓库生成交互式文档和知识库。自2025年4月27日发布以来，DeepWiki迅速成为开发者社区的热门工具，被誉为“GitHub的维基百科”。方法2 把github代码仓库中的地址github.com 替换成deepwiki.com。方法1 可以直接在官方首页中搜索想要查看的代码仓库。

2025-06-01 12:18:54 228

原创豆包Seed 1.5 VL模型实现目标检测

Seed1.5-VL 在 60 项公开基准测试中取得了 38 项的最新最优性能（state-of-the-art performance），其中包括 19 项视频基准测试中的 14 项，以及 7 项 GUI 代理任务中的 3 项。Seed 1.5 -VL 是字节跳动近期发布的视觉语言多模态大模型。

2025-05-16 18:35:16 171

原创 coco数据集mAP评估

用pycocotools评估时，需要把结果保存为coco格式的json文件。2个评估结果略有差别，但差别不大。

2025-05-13 19:34:36 457 2

原创查询nvidia边缘设备的软硬件版本jetson_release

通过jetson_release命令可查询nvidia边缘设备的软硬件版本。

2025-05-07 19:53:54 161

原创 Nvidia Orin 安装onnxruntime-gpu

在用英伟达边缘设备Nvidian Orin 安装onnxruntime-gpu环境时，通常会遇到很多问题。在正常的Nvidia 服务器上安装onnxruntime-gpu 是非常简单的，直接即可，但是在边缘设备上就没有这么简单了。直接是找不到相应的包的。

2025-05-07 19:46:29 715

原创 pip安装包时出现网络问题的坑

可以通，因此怀疑是网络代理问题或者路由问题。更换多个国内源依然出现网络超时错误。更换有线网，共享网络均不奏效。

2025-05-07 19:26:53 305

原创 Qwen2.5-VL 模型实现目标检测

因为模型和权重是开源的，可以本地部署，也可以直接使用api调用更为方便。Qwen2.5-VL模型是一个视觉语言多模态大模型。

2025-04-30 12:09:38 904

原创 yolo-world踩坑指南

官方源码： https://github.com/AILab-CVC/YOLO-World安装这一块的坑很多，这一块的安装指导非常混乱，很容易把环境搞崩，建议conda 新建一个环境。pip install -e . 直接安装的话，会报各种版本的错。另外还有一些依赖未包含，运行时会报错。索性手动安装了所需要的依赖包。最终安装的可以使用的版本:注意。上面安装的mmcv的版本不满足要求，会报错，具体报错如下：是因为版本不满足要求，目标版本装了好久没装上，最后的解决办法简单粗暴，直接吧报错的

2025-04-27 19:04:07 536

原创 ubuntu命令行连接网络

【代码】ubuntu命令行连接网络。

2025-04-09 16:46:18 288

原创详解相机的内参和外参，以及内外参的标定方法

首先空间中的一点由世界坐标系转换到相机坐标系，然后再将其投影到物理成像平面 ( 成像平面坐标系 ) ，最后再将成像平面上的数据转换像素坐标系。相机内参表达的就是这三个坐标之间的转换关系，而相机外参表达的是相机与世界坐标系之间的转换关系。常用求解PnP 的方法，即已知多个点，在像素坐标系的二维坐标，和在世界坐标系的三维坐标，并且已知内参，求解旋转平移矩阵。外参标定的核心是：已知多个点分别在相机坐标系下的坐标和在世界坐标系下的坐标，求它们之间的映射关系。，在相机坐标系下的坐标为。

2025-04-02 20:52:49 3762

原创单应矩阵和旋转平移矩阵的区别与联系

单应矩阵单应矩阵是一个3×3的矩阵，通常用于描述两个平面之间的投影变换。它能够将一个平面上的点映射到另一个平面上的点。在图像处理中，单应矩阵常用于图像的平面变换，例如图像拼接、图像矫正等场景。它可以通过对应点对（即两个平面上的点对）来估计得到。

2025-03-25 15:56:27 876

原创带旋转的目标标注工具-X-AnyLabeling

对于2D目标检测标注，上面的工具只能标注不带旋转的检测框。但是如果我们要进行带旋转方向的检测（OBB），就需要标注带旋转的数据，这个时候可以使用X-AnyLabeling 这款工具。

2025-03-19 20:05:37 1051

原创推荐一款沉浸式翻译神器

这个工具名字就叫沉浸式翻译。

2025-03-18 20:21:48 692

原创修改HuggingFace模型默认缓存路径

huggingface模型的默认缓存路径是通常修改为自己的路径会更为方便。

2025-03-18 19:57:58 789

原创智能标注工具 T-Rex Label

该工具可以进行自动化标注，只需框选出一个标记，就可以自动标注出图片中所有的其他同类物体。支持到处YOLO 和COCO格式。首先使用智能标注，可以标注出大部分的物体，如果有错的或者漏的，可以删除，也可以使用矩形框工具进行手动增加。

2025-03-10 19:49:27 450 2

原创 DINO， Grounding DINO, DINO-X系列工作解读

有2个版本的模型，分别是Pro和Edge, Pro主打效果好， Edge版本主打高性能，牺牲了一定的效果。把闭集检测器划分为3个阶段，并且在3个阶段都进行了融合，包括特征增强，语言引导的查询选择和交叉模态的编码器。这也是区别其他方法的地方，其他方法一般在1-2个阶段进行融合。DINO-X 具备了基础的目标级别的表征能力，可以支持多种目标感知和理解的任务，比如检测，分割，姿态估计，问答等等。DINO 的主要贡献是在之前的DETR系列工作上提出了3点改进，从而提升了模型的性能和效率。

2025-03-05 20:00:38 1487

原创 LieGrasPFormer: Point Transformer-based 6-DOF Grasp Detectionwith Lie Algebra Grasp Representation解读

LieGrasPFormer 生成 256 个抓取配置及其对应的抓取质量，并通过碰撞检测筛选出无碰撞且抓取质量高的配置进行抓取细化。在 PyBullet 环境中，展示了不同初始机器人关节配置下的抓取结果，验证了 LieGrasPFormer 能够生成多样化的抓取配置，满足各种初始抓取配置，适用于运动规划。假设预测的抓取质量遵循高斯分布，预测的抓取配置越接近真实抓取配置，抓取质量越高。其中，cj,gcj,g表示在抓取点qjqj处的抓取质量，qgqg表示真实抓取点，δδ是高斯分布的标准差。

2025-02-26 20:13:41 1075

原创 Task-Oriented 6-DoF Grasp Pose Detection in Clutters 解读

通过构建大规模的 6DTG 数据集和提出任务导向点选择及任务引导抓取姿态检测模块，OSTG 方法在多个指标上显著优于现有方法。：首先，构建了一个大规模的 6自由度任务导向抓取数据集（6DTG），包含 4391 个杂乱场景和超过 200 万个 6自由度抓取姿态。去除任务导向点选择模块后，点特征在二维空间中混合，而使用完整模型的点特征则按对象标签分组，表明模型在点特征空间中学习到了区分不同对象的区域。：在选定的任务导向点基础上，提出了一种任务引导的抓取姿态检测模块，直接检测任务导向的 6自由度抓取旋转。

2025-02-26 19:49:36 891

原创 Rethinking 6-Dof Grasp Detection: A Flexible Framework forHigh-Quality Grasping 解读

这篇论文提出了一种灵活的 6-Dof 抓取检测框架 FlexLoG，通过局部抓取模型和灵活引导模块，能够处理场景级和目标导向抓取。：在 GraspNet-1Billion 数据集上，FlexLoG 在相似和新颖的分割上分别实现了 10.4/9.83 和5.73/3.89 的性能提升，优于现有方法。：FGM 能够兼容全局（如抓取热图）和局部（如视觉定位）引导方法，生成高质量的抓取。LoG 采用基于 PointMLP 的轻量级编码器结构，通过三个专门的头部（碰撞头部、方向头部和偏移头部）预测抓取的各种属性。

2025-02-25 19:46:52 723

原创 Efficient Heatmap-Guided 6-Dof Grasp Detection inCluttered Scenes 解读

这篇论文提出了一种新的端到端 6-Dof 抓取姿态检测框架，通过全局到局部和语义到点的方案，在两个代表性数据集上实现了最先进的性能，且比所有现有方法快得多。尽管该框架是单视图和开环的，限制了其在更复杂场景中的应用，但未来的工作将利用其进行闭环抓取检测，使机器人能够调整预测的抓取姿态并响应环境变化。：在 UR-5e 机器人上进行的实验表明，HGGD 能够成功应用于真实世界，生成高质量的抓取，成功率高达 94%，杂乱完成率为 100%。：该模块利用 GHM 生成的热图作为指导，聚合局部点云并检测抓取。

2025-02-25 19:39:37 1020

RAG( Retrieval Augmented Generation)简单实现

空空如也