IRevers-CSDN博客

原创【Agent】基于Langchain的Agent数据库查询助手

本文介绍了基于深度代理框架(deepagents)的SQL查询智能代理系统。该系统支持本地Ollama模型和云端OpenAI API两种运行模式，提供数据库连接、技能存储和记忆系统等功能。配置方面详细说明了环境变量设置和两种运行模式的选择。测试结果显示，本地Ollama模式(Gemma4模型)准确但耗时较长(约35分钟)，而云端OpenRouter模式仅需23秒即可完成相同任务。项目代码已开源，包含完整的数据库工具链和监控功能，为开发者提供了灵活的SQL查询自动化解决方案。

2026-04-26 23:25:19 408

原创【YOLO】YOLO-Master 腾讯轻量级YOLO架构超越YOLO-13（含检测和分割推理）

YOLO-Master 腾讯春节开发的轻量级YOLO，超过YOLOv13。

2026-02-19 22:57:46 817

原创 RF-DETR：第一个在COCO上突破60AP的DETR（含检测和分割推理）

RF-DETR第一个在COCO上突破60AP的实时检测器。

2026-01-31 14:44:22 901

原创【YOLO】YOLO26助力YOLO推理速度再提升

YOLO26在2026年初卷土重来，在速度和精度上取得再提升。

2026-01-25 19:51:38 1153 1

原创【图像分割】深度学习的图像分割损失函数总结

总结深度学习的图像分割损失函数。

2026-01-10 14:11:59 1349

原创【目标检测】深度学习目标检测损失函数总结

总结深度学习目标检测相关损失函数设计。

2026-01-10 13:59:09 1370

原创【大模型】基于LazyLLM的日志助手开发

LazyLLM是一个简化大型语言模型应用开发的开源工具，支持模型部署、微调、推理优化和API封装。本文以智谱GLM为例，介绍API key申请和环境变量设置步骤，并展示如何基于LazyLLM开发日志分析助手。该助手能分类解析日志文件（ERROR/WARNING/INFO），通过GLM模型响应用户查询，提供日志统计和详情。示例代码包含日志解析、分类统计和交互查询功能，适用于快速构建私有化LLM应用。项目代码已开源，支持多种主流LLM平台接入。

2025-09-24 16:52:52 707

原创【多任务YOLO】A-YOLOM

本文提出了一种轻量级实时多任务模型A-YOLOM，用于自动驾驶中的目标检测、可驾驶区域分割和车道线分割。该模型采用统一的分割结构和自适应拼接模块，通过可学习参数优化特征融合，简化了分割头设计并使用相同的损失函数处理所有分割任务。在BDD100k数据集上，A-YOLOM实现了81.1%的mAP50（检测）、91.0%的mIoU（可驾驶区域）和28.8%的IoU（车道线）。实验表明，该模型在真实场景中的表现优于对比方法，展现出良好的泛化能力和部署潜力。

2025-07-22 22:35:30 1084 4

原创【自动驾驶】经典LSS算法解析——深度估计

LSS（Lift, Splat, Shoot）是一种将多相机图像转换为BEV（鸟瞰图）特征的3D感知方法。其核心流程分为三步：首先通过深度估计将2D图像升维为3D视锥点云（Lift）；然后将点云特征投影到BEV空间并聚合（Splat）；最后在BEV特征上进行路径规划等任务（Shoot）。该方法采用EfficientNet提取图像特征，利用相机内外参将特征投影到200×200的BEV网格（50m×50m范围），通过深度概率分布实现精准特征转换。LSS支持多相机融合，适用于自动驾驶中的语义分割和轨迹预测任务。

2025-07-09 20:16:54 1448

原创【模型微调】 5%＞100%:BreakingPerformance Shackles of Full Fine-Tuning on Visual Recognition Tasks

作者提出了Multi-cognitive Visual Adapter (Mona) 调优，这是一种新颖的基于适配器的调优方法。

2025-06-03 22:35:37 969

原创 MMDetection3D最全源码安装教程

MMDetection3D安装教程

2025-05-25 21:48:03 2094

原创【CVPR2025】Transformers without Normalization

本研究表明，没有归一化的transformer（transformer）可以通过一种简单的技术实现相同或更好的性能。作者引入动态双曲正切（Dynamic Tanh，DyT），一个逐元素操作 $DyT(x) = tanh(\alpha x)$，作为transformer中归一化层的直接替代。 DyT的灵感来自于观察到 transform（transformer）中的层归一化通常生成类似tanh的 S 形输入输出映射。

2025-03-16 19:02:18 1589

原创【问题解决】libcudart.so.11.0: cannot open shared object file: No such file or directory

【问题解决】libcudart.so.11.0: cannot open shared object file: No such file or directory

2025-03-03 22:37:06 4780

原创 YOLOv12最全使用教程【含ONNX模型推理】

YOLOv12在所有流行的实时目标检测器中，在准确性方面超越了它们，并且速度具有竞争力。例如，YOLOv12-N在T4 GPU上实现了40.6%的mAP，推理延迟为1.64毫秒，相比先进的YOLOv10-N/YOLOv11-N，在相当的速度下，**mAP提高了2.1%/1.2%**。这种优势也扩展到了其他模型规模。YOLOv12还超过了那些改进DETR的端到端实时检测器，如RT-DETR/RT-DETRv2：YOLOv12-S在运行速度比RT-DETR-R18/RT-DETRv2-R18快42%的情况下，仅

2025-02-22 20:29:28 4417

原创 Deepseek本地部署最全教程(Ollama安装)

最近，Deepseek在互联网掀起一阵浪潮，原因在于其用较低的成本训练出一个能和openai的chatgpt4媲美的大模型deepseek。

2025-02-09 09:21:43 868

原创【Pytorch和Keras】使用transformer库进行图像分类

现在大多数的模型都会上传到huggface平台进行统一的管理，transformer库能关联到huggface中对应的模型，并且提供简洁的transformer模型调用，这大大提高了开发人员的开发效率。本博客主要利用transformer库实现一个简单的模型微调，以进行图像分类的任务。

2025-02-01 18:09:34 2005

原创【CAN】asc报文格式文件合并（python版）

本博客主要介绍了如何用python根据时间对asc格式报文文件进行合并，方便进行后期的数据读取和整合。

2024-12-14 13:12:59 2407

原创使用Python和Pybind11调用C++程序（CMake编译）

pybind11 是一个轻量级的头文件库，用于在 Python 和 C++ 之间互相暴露类型，主要用于为现有的 C++ 代码创建 Python 绑定。

2024-11-26 23:05:15 1949

原创 huggingface模型下载最全指南

本博客将会从huggingface的注册登录、获取许可权限和下载模型三个部分进行讲解，希望能帮助读者学会如何从huggingface中下载模型权重和配置文件。

2024-11-20 23:58:01 6621

原创【论文速看】DL最新进展20241119-CNN、模型压缩、图像修复

【论文速看】DL最新进展20241119-CNN、模型压缩、图像修复

2024-11-19 23:26:09 1363

原创【论文速看】DL最新进展20241118-人脸、视频生成

【论文速看】DL最新进展20241118-人脸、视频生成

2024-11-18 23:49:44 620

原创【论文速看】DL最新进展20241117-视频分割、CNN、图像修复

【论文速看】DL最新进展20241117-视频分割、CNN、图像修复

2024-11-17 22:17:54 923

原创【论文速看】DL最新进展20241115-20241116

为了促进有效的决策制定，世界模型必须具备强大的泛化能力，以支持在分布外（OOD）区域的想象，并提供可靠的不确定性估计来评估模拟体验的可信度，这两者对于先前的可扩展方法都是重大挑战。下评估的E2E-AD方法，它们在固定路线上进行测试（例如，CARLA中的Town05Long和Longest6），以驾驶得分作为指标，由于指标函数不平滑和长路线中的大随机性，这种方法已知具有高变异性。大多数先前的最先进的方法都是静态的、手工制作的网络，这不仅严重依赖于专家知识，而且忽略了输入样本的语义多样性，因此导致性能不佳。

2024-11-16 21:29:40 909