- 博客(202)
- 收藏
- 关注
原创 模型上下文协议(MCP)实践指南
本文介绍了Model Context Protocol (MCP) Python SDK的安装和使用过程。首先需要通过pip install "mcp[cli]"安装MCP,要求Python版本大于3.10。运行测试demo时可能遇到"npx not found"错误,需安装Node.js和npm。在Ubuntu系统中可使用sudo apt install nodejs npm安装依赖,但会连带安装大量其他组件。安装完成后还需自动安装@modelcontextprot
2025-06-10 20:29:53
722
原创 大模型编程助手-Cline
Cline 是一款深度集成在 Visual Studio Code(VSCode) 中的开源 AI 编程助手插件,旨在通过结合大语言模型(如 Claude 3.5 Sonnet、DeepSeek V3、Google Gemini 等)和工具链,为开发者提供自动化任务执行、智能代码生成、错误修复等功能,显著提升开发效率。
2025-06-06 20:00:53
228
原创 cursor和windsurf使用体验对比
比如, 我有一个纯函数的python代码文件, 想重构成一个类的形式。cursor会直接把所有方法都写成静态方法,一些公用参数也不会抽出来。windsurf会写成普通类方法,并抽出一些公用参数放在__init__中。1 交互不太友好, 对当前选中的代码经常搞错。比如,不知道当前打开的代码文件, 光标停留或选中的代码片段无法直接交互。而windsurf 能知道当前的代码文件,可以基于光标停留的位置或选中的代码片段进行交互。3 模型的选择不够多。windsurf可以自由选择模型, 还有很多免费的。
2025-06-06 16:26:25
585
原创 大模型编程助手-windsurf
可以选择不同的模型, 有些模型是免费的, 有些是要花积分的。比如GPT-4.1(promo)需要0.25积分, deepseek就是免费的。积分是按次收的,无论问题复杂度如何。2 在pycharm中通过插件使用。1 使用windsurf的IDE。
2025-06-06 15:26:51
230
原创 torch.distributed.launch 、 torchrun 和 torch.distributed.run 无法与 nohup 兼容
报错的原因可能是torch.distributed.launch 、 torchrun 和 torch.distributed.run 无法与 nohup 兼容 , 当ssh连接断开, 窗口被关闭时,torch.distribute 接管了相关异常, 导致nohup没起作用。
2025-06-03 11:17:48
550
原创 推荐一款代码阅读神器-deepwiki
DeepWiki是由Cognition AI(Cognition Labs)基于其明星产品Devin(全球首个AI软件工程师)开发的一款开源工具,旨在通过AI技术为GitHub代码仓库生成交互式文档和知识库。自2025年4月27日发布以来,DeepWiki迅速成为开发者社区的热门工具,被誉为“GitHub的维基百科”。方法2 把github代码仓库中的地址github.com 替换成deepwiki.com。方法1 可以直接在官方首页中搜索想要查看的代码仓库。
2025-06-01 12:18:54
228
原创 豆包Seed 1.5 VL模型 实现目标检测
Seed1.5-VL 在 60 项公开基准测试中取得了 38 项的最新最优性能(state-of-the-art performance),其中包括 19 项视频基准测试中的 14 项,以及 7 项 GUI 代理任务中的 3 项。Seed 1.5 -VL 是字节跳动近期发布的视觉语言多模态大模型。
2025-05-16 18:35:16
171
原创 Nvidia Orin 安装onnxruntime-gpu
在用英伟达边缘设备Nvidian Orin 安装onnxruntime-gpu环境时, 通常会遇到很多问题。在正常的Nvidia 服务器上安装onnxruntime-gpu 是非常简单的, 直接即可, 但是在边缘设备上就没有这么简单了。直接是找不到相应的包的。
2025-05-07 19:46:29
715
原创 pip安装包时出现网络问题的坑
可以通, 因此怀疑是网络代理问题或者路由问题。更换多个国内源依然出现网络超时错误。更换有线网, 共享网络均不奏效。
2025-05-07 19:26:53
305
原创 Qwen2.5-VL 模型实现目标检测
因为模型和权重是开源的, 可以本地部署, 也可以直接使用api调用更为方便。Qwen2.5-VL模型是一个视觉语言多模态大模型。
2025-04-30 12:09:38
904
原创 yolo-world踩坑指南
官方源码: https://github.com/AILab-CVC/YOLO-World安装这一块的坑很多,这一块的安装指导非常混乱,很容易把环境搞崩, 建议conda 新建一个环境。pip install -e . 直接安装的话, 会报各种版本的错。 另外还有一些依赖未包含, 运行时会报错。索性手动安装了所需要的依赖包。最终安装的可以使用的版本:注意。 上面安装的mmcv的版本不满足要求,会报错, 具体报错如下:是因为版本不满足要求, 目标版本装了好久没装上, 最后的解决办法简单粗暴, 直接吧报错的
2025-04-27 19:04:07
536
原创 详解相机的内参和外参,以及内外参的标定方法
首先空间中的一点由世界坐标系转换到相机坐标系 ,然后再将其投影到物理成像平面 ( 成像平面坐标系 ) ,最后再将成像平面上的数据转换像素坐标系。相机内参表达的就是这三个坐标之间的转换关系, 而相机外参表达的是相机与世界坐标系之间的转换关系。常用求解PnP 的方法,即已知多个点, 在像素坐标系的二维坐标, 和在世界坐标系的三维坐标,并且已知内参, 求解旋转平移矩阵。外参标定的核心是:已知多个点分别在相机坐标系下的坐标和在世界坐标系下的坐标, 求它们之间的映射关系。, 在相机坐标系下的坐标为。
2025-04-02 20:52:49
3762
原创 单应矩阵和旋转平移矩阵的区别与联系
单应矩阵单应矩阵是一个3×3的矩阵,通常用于描述两个平面之间的投影变换。它能够将一个平面上的点映射到另一个平面上的点。在图像处理中,单应矩阵常用于图像的平面变换,例如图像拼接、图像矫正等场景。它可以通过对应点对(即两个平面上的点对)来估计得到。
2025-03-25 15:56:27
876
原创 带旋转的目标标注工具-X-AnyLabeling
对于2D目标检测标注, 上面的工具只能标注不带旋转的检测框。但是如果我们要进行带旋转方向的检测(OBB), 就需要标注带旋转的数据, 这个时候可以使用X-AnyLabeling 这款工具。
2025-03-19 20:05:37
1051
原创 智能标注工具 T-Rex Label
该工具可以进行自动化标注, 只需框选出一个标记, 就可以自动标注出图片中所有的其他同类物体。支持到处YOLO 和COCO格式。首先使用智能标注, 可以标注出大部分的物体, 如果有错的或者漏的, 可以删除, 也可以使用矩形框工具进行手动增加。
2025-03-10 19:49:27
450
2
原创 DINO, Grounding DINO, DINO-X系列工作解读
有2个版本的模型, 分别是Pro和Edge, Pro主打效果好, Edge版本主打高性能, 牺牲了一定的效果。把闭集检测器划分为3个阶段, 并且在3个阶段都进行了融合, 包括特征增强, 语言引导的查询选择 和交叉模态的编码器。这也是区别其他方法的地方, 其他方法一般在1-2个阶段进行融合。DINO-X 具备了基础的目标级别的表征能力, 可以支持多种目标感知和理解的任务, 比如检测, 分割, 姿态估计, 问答等等。DINO 的主要贡献是在之前的DETR系列工作上提出了3点改进, 从而提升了模型的性能和效率。
2025-03-05 20:00:38
1487
原创 LieGrasPFormer: Point Transformer-based 6-DOF Grasp Detectionwith Lie Algebra Grasp Representation解读
LieGrasPFormer 生成 256 个抓取配置及其对应的抓取质量,并通过碰撞检测筛选出无碰撞且抓取质量高的配置进行抓取细化。在 PyBullet 环境中,展示了不同初始机器人关节配置下的抓取结果,验证了 LieGrasPFormer 能够生成多样化的抓取配置,满足各种初始抓取配置,适用于运动规划。假设预测的抓取质量遵循高斯分布,预测的抓取配置越接近真实抓取配置,抓取质量越高。其中,cj,gcj,g表示在抓取点qjqj处的抓取质量,qgqg表示真实抓取点,δδ是高斯分布的标准差。
2025-02-26 20:13:41
1075
原创 Task-Oriented 6-DoF Grasp Pose Detection in Clutters 解读
通过构建大规模的 6DTG 数据集和提出任务导向点选择及任务引导抓取姿态检测模块,OSTG 方法在多个指标上显著优于现有方法。:首先,构建了一个大规模的 6自由度任务导向抓取数据集(6DTG),包含 4391 个杂乱场景和超过 200 万个 6自由度抓取姿态。去除任务导向点选择模块后,点特征在二维空间中混合,而使用完整模型的点特征则按对象标签分组,表明模型在点特征空间中学习到了区分不同对象的区域。:在选定的任务导向点基础上,提出了一种任务引导的抓取姿态检测模块,直接检测任务导向的 6自由度抓取旋转。
2025-02-26 19:49:36
891
原创 Rethinking 6-Dof Grasp Detection: A Flexible Framework forHigh-Quality Grasping 解读
这篇论文提出了一种灵活的 6-Dof 抓取检测框架 FlexLoG,通过局部抓取模型和灵活引导模块,能够处理场景级和目标导向抓取。:在 GraspNet-1Billion 数据集上,FlexLoG 在相似和新颖的分割上分别实现了 10.4/9.83 和5.73/3.89 的性能提升,优于现有方法。:FGM 能够兼容全局(如抓取热图)和局部(如视觉定位)引导方法,生成高质量的抓取。LoG 采用基于 PointMLP 的轻量级编码器结构,通过三个专门的头部(碰撞头部、方向头部和偏移头部)预测抓取的各种属性。
2025-02-25 19:46:52
723
原创 Efficient Heatmap-Guided 6-Dof Grasp Detection inCluttered Scenes 解读
这篇论文提出了一种新的端到端 6-Dof 抓取姿态检测框架,通过全局到局部和语义到点的方案,在两个代表性数据集上实现了最先进的性能,且比所有现有方法快得多。尽管该框架是单视图和开环的,限制了其在更复杂场景中的应用,但未来的工作将利用其进行闭环抓取检测,使机器人能够调整预测的抓取姿态并响应环境变化。:在 UR-5e 机器人上进行的实验表明,HGGD 能够成功应用于真实世界,生成高质量的抓取,成功率高达 94%,杂乱完成率为 100%。:该模块利用 GHM 生成的热图作为指导,聚合局部点云并检测抓取。
2025-02-25 19:39:37
1020
原创 Graspness Discovery in Clutters for Fast and Accurate Grasp Detection 解读
首先,定义了两种抓取性分数:点抓取性分数SpSp和视图抓取性分数SvSv。点抓取性分数表示每个点的抓取可能性,视图抓取性分数表示每个视图的抓取可能性。
2025-02-21 20:17:32
1199
原创 pytorch3d安装记录
我是直接下载的源码安装, 但是执行python setup.py install 时有各种编译报错, 其实怀疑是gcc版本问题, gcc 版本 从gcc-7, gcc-8, gcc-9, gcc-10, gcc-11 都试了一遍, 都有不同的编译报错。通过pip 或conda 可以很容易安装上预编译好的包, 安装过程不会报错, 但是使用的时候就会报各种错误 ,原因是预编译好的包跟自己的环境不一定匹配, 比如CUDA版本, torch版本等。
2025-02-20 18:59:03
379
原创 ptython setup.py install 设置python包编译时的并行数
通过源码编译安装pytorch3d的时候, 直接执行python setup.py install 时, 默认开的并行数很多, 有10几个, 直接导致机器卡死。通过设置下面的环境变量, 可以设置较小的并行数, 避免占用过多的资源。设置后, 同时只有4个编译的进程。
2025-02-20 15:20:36
259
原创 安装MinkowskiEngine记录
在我的环境中, 直接pip安装一直编译错误。一开始是因为gcc版本过高(11.x), 无法编译MinkowskiEngine, 后来降低gcc版本到7.5 编译依然报错。降低gcc版本, 请参考。最后下载了源码, 通过。
2025-02-18 20:04:12
478
2
原创 解决 THC/THC.h: No such file or directory 报错
出现THC/THC.h: No such file or directory 这个问题的原因主要是:pytorch在1.11版本之后,THC/THC.h就被移除了,所以出现这个问题的原因是因为pytorch版本太高的原因。解决这个问题一个最直观的方法就是降版本,如果不更改版本的话, 需要修改源代码。下面的代码库中已经修改了对应的代码, 可以从这个库中下载代码,即可成功编译。
2025-02-14 14:22:19
431
原创 Unbuntu 22.04 安装 GCC 7.5版本
Unbuntu 22.04 默认的gcc版本是11, 版本太高, 无法编译Minkowski Engine。安装是找不到这么低的旧版本的,因此需要首先添加包含这个版本的源头。因此需要安装低版本的gcc。
2025-02-12 14:13:51
725
原创 解决 ssh: connect to host github.com port 22: Connection timed out
参考链接: https://zhuanlan.zhihu.com/p/521340971。出现这个错误的原因是 22 端口被防火墙屏蔽了, 换一个端口即可,如443端口。
2025-02-07 18:40:19
742
原创 目标检测,语义分割标注工具--labelimg labelme
labelimg可以用来标注目标检测的数据集, 提供多种格式的输入, 如Pascal Voc, YOLO等。
2024-12-28 23:30:40
1224
原创 pytorch GPU版本安装
现在的安装已经很简单了, 一键式安装即可。网上的很多安装教程已经过时了, 不用像很早之前一样手动安装cuda toolkit, cudnn了, 直接安装的pytorch版本中已经包含了相关的包。
2024-12-28 12:50:45
221
原创 无需tokenizer--Byte Latent Transformer: Patches Scale Better Than Tokens
https://mp.weixin.qq.com/s/7ju-PjPZVPrBLQ1qFnFoKw
2024-12-17 12:00:30
210
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人