啥都会一点的老程，自在地镜强者-CSDN博客

原创 Mergekit——任务向量合并算法Ties解析

Mergekit ties的配置参考models:- model: psmathur/orca_mini_v3_13b #参考模型1density: [1, 0.7, 0.1] # density gradient 这是稀疏化的密度列表对应不同层的稀疏化成都weight: 1.0 #权重值- model: garage-bAInd/Platypus2-13B #参考模型2 其余同上- model: WizardLM/WizardMath-13B-V1.0 #参考模型3 其余同上。

2025-05-19 18:03:30 1079

原创 2024-10月的“冷饭热炒“--解读GUI Agent 之computer use？phone use?——多模态大语言模型的应用进阶之路

ComputerTool：这个工具可能包含了一些特定于Windows的操作，例如使用PyAutoGUI进行鼠标点击、键盘输入、截图等操作。这里贴下源码：简单来说就算计算机工具的各种操作函数和动作描述等。

2024-10-28 17:11:42 2407

原创超速解读多模态InternVL-Chat1.5 ，如何做到开源SOTA——非官方首发核心技巧版（待修订）

快速了解最接近GPT-4的多模态大模型 InternVL chat 1.5如何做到SOTA的

2024-06-06 22:15:28 2527

原创 CV算法工程师的LLM日志（5）Mixture-of-depths——transformers改进结构【15分钟代码和原理速通】

Mod通俗易懂的代码和原理

2024-04-22 18:07:41 1537 1

原创 Cv算法工程师的LLM日志(4)大模型主流技术及MOE系列——基于Qwen-moe特别篇（4月开更，持续更新）【首发最强解析—以代码串讲LLM主流技术】

以QWEN1.5-MOE源码解读为基准，串讲所有LLM开源主流技术和Moe模块，本质上和用什么模型无关，开源模型用到的技术基本都源于LLAMA和MISTRAL系列

2024-04-09 17:45:09 1609 1

原创 CV算法工程师的LLM日志（3）LLM偏好对齐训练技术——ORPO【全网首发：15分钟代码和原理速通】

ORPO作为新的一种人类偏好对齐训练方法，来看看与现在流行的DPO有何区别，15分钟速通

2024-04-07 17:03:09 5003 1

原创 CV算法工程师的LLM日志(2)PEFT训练技术——10分钟快速理解DORA【原理&&代码】

10分钟带你快速了解DORA的PEFT方法原理和代码

2024-03-23 17:31:17 1758 2

原创 SORA技术报告快速解读——浅谈其AIGC积累的技术底蕴(待修订)

浅谈SORA技术方案

2024-02-22 12:17:26 1203

原创 CV算法工程师的LLM日志(1)微调技术——即插即用的neft-Tune【原理&&代码】

今年转战LLM，分享点点滴滴，NBFT微调插件

2023-10-23 15:34:24 922

原创一点就分享系列(理解篇6—上篇Painter）【4月10号解读版全网首发含核心代码】BAAI_2023出品浅析双论文组合Painter&&SegGPT，主打统一多任务的图生图视觉模型

AIGC

2023-04-10 20:39:45 3892 4

原创一点就分享系列(理解篇5）Meta 出品 Segment Anything 4月6号版核心极速解读——主打一个”Zero shot“是贡献和辅助，CV依然在！

zero-shot零样本迁移模型介绍SAM速读拓展和应用

2023-04-07 17:46:19 2184

原创 2022/3/22 从CV方向角度 —快速解读Nvidia 2023GTC

2023GTC 观后感

2023-03-22 15:05:49 1092

原创一点就分享系列（实践篇6——上篇）【迟到补发_详解yolov8】Yolo-high_level系列融入YOLOv8 旨在研究和兼容使用【3月份开始持续补更】

[迟到补发]—Yolo系列算法开源项目融入V8旨在研究和兼容使用[持续更新]

2023-03-09 20:38:30 3446 20

原创 2022年人体姿态估计——SOTA关键点检测浅析总结【极简压缩篇】

pose估计——关键点检测思路整理

2022-10-25 20:11:00 3764

原创 10.24 cv方向3DMM必备环境——Windows10/11下pytorch3d[完美安装版]

windows10、11 pytorch3d编译安装

2022-10-24 09:45:17 4434 17

原创 Nvidia Maxine 精讲 (二)AR SDK—— FaceTrack &&Mesh&&Expression【非官方全网首发】

人脸mesh动画生成 maxsine sdk使用

2022-10-11 17:34:12 2263

原创 Nvidia Maxine 精讲（一）AR-SDK安装使用——BodyTrack 【非官方全网首发】

Nvidia maxine SDK(一) 使用描述以及bodytrack代码演示功能说明

2022-10-10 18:19:50 6794 3

原创一点就分享系列（实践篇5-下篇）持续迭代！依旧全网首发—Yolov5项目爆肝升级High-level集结！逐一任务介绍，附赠模型通用修改方法和部署教程。

YOLOv5-high-level全家桶目前已经基本完成了，今天完成了POSE部分的测试，有兴趣的可以先GIT测试反馈，具体说明和后续会慢慢调试完善，核心东西还是GIT项目，所以先发布下，可以先看README，结束本周辛苦的工作，刚看V5官方也正式发布了分割部分，下周见朋友们！火速迭代中，有问题可以留言，会及时修复，项目由于大量更新难免存在小问题，欢迎反馈，另外有虚拟人，动捕的朋友请联系，想请教交流下技术。

2022-09-16 19:19:08 3428 29

原创一点就分享系列（实践篇5-上篇）[持续更新中！代码已吸收！依旧全网首发] yolov7解析：yolov5的plus扩充，仍旧值得学习！一起看V5代码如何变成V7！

V7来了，话不多说，强行回归，之前提到的一些nanodet/yolox的优化技巧，没想到V7也做了，这样挺好，减少了不少工作量，大体今天上午看了下主要是两部分核心:网络结构和辅助训练分支，从V7仓库适配了下代码，才发现缝合度极度严重，其实就是魔改版的V5，不过仍旧有值得学习的东西，同时想起V6（mt），让我明白一个道理：做事情一定要快！于是下午我就把V7之于V5的区别对比了下，并基于我自己的魔改版V5仓库进行了V7的添加，基本全程没什么大坑，还是比较容易的，分享在我的github上.............

2022-07-07 20:15:27 8633 61

原创 Mediapipe 人体姿态估计专题（一） Blaze组件算法之Blazeface （带一个小开源分享给大家）

Mediapipe 人体姿态估计专题

2022-07-05 18:12:06 2786 4

原创一点就分享系列（理解篇5）补更必看：SwintransformerV2.0版本的改进以及使用理解(上篇)

一点就分享系列（理解篇4） SwintransformerV2的学习使用理解分享之前在V5的gi中更新了swintransformerV2的代码，发现训练起来一堆问题（主要还是堆叠起来难以训练），于是今天抽时间再研究一下，顺便补一补博客的更新，所以废话不多说，关于 SwinV1的讲解网上太多了，写的都很好，我就不去解析了。今天的重点是一些思考和记录！SwintransformerV2的学习理解感悟分享一点就分享系列（理解篇4） SwintransformerV2的学习使用理解分享一、Swin Trans

2022-03-28 22:17:31 11225 64

原创一点就分享系列（实践篇4-上篇）深度学习部署之Tensorrt转换思路：“授人与鱼不如授人与渔”

Tensorrt模型转换使用思路： “授人与鱼不如授人与渔”最近做完了C++部署后，回过头来搞了几天模型转换，这一部分操作我之前只是当作工具最快时间搞定就不管了（内心还是渴望做研究的）之前大家做部署时候在转换时候用ONNX遇到不少坑，去年参考了wangxinyu git的模型demo，最近又看了看源码，趁着自己在撸tensorrt API顺手和大家分享下，该篇核心目的：分享我工作中常用到的模型转换操作方法和思路，千篇一律的东西我尽量少写，比如API尽量鼓励大家去自己看手册调试理解，希望尽量泛化性地理清逻辑

2021-12-02 16:51:34 4197 1

原创一点就分享系列—2021.10.12 紧急更新“彩蛋” YOLOv5 v6.0 release 改动速览

前言最近解耦头训练后发现代码有问题，加上各种事情先搁置了，因为有些朋友总是提到SWIN-Transformer ，那么我决定先研读下，swin的代码，今天分享下昨晚上V5的新版V6.0的改动，同时说下我的个人理解。（最近在研究人脸的东西，提供了一个即插即用的，当然很多地方需要补充，先放在GIT上了可以直接使用要做业务的可以直接拿来主义，还有Deepstream的SDK详情关注------->face git repo） Yolov5系列文章参考一点就分享系列yolov5（实践篇3

2021-10-13 20:37:29 9816 31

原创一点就分享系列（实践篇3-下篇）（3月1号更新：释出swintransformer2改进点和代码）— yolov5之“回顾总结”与“彩蛋附赠”+“后续模型设计“+永不完结的更新idea“

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例

2021-09-16 01:11:39 11608 124

原创目标检测之深度学习专题（一）FCOS-“抛砖引玉“！验证检测模型理解的最好”试金石“——细节决定成败，不看就会败北！

目标检测之深度学习专题（一）FCOS-“抛砖引玉”！验证检测模型理解的最好”试金石“——细节决定成败，不看就会败北！本系列只针对当前文章内容进行解析，避免出现耦合太多相关内容，方便大家理解快速学习！很多人都知道Fcos的结论和意义，但是知道和理解完全是两回事，不管你是谁，不懂就学，是永远不会错的!FCOS（Fully Convolutional One-Stage Object Detection ）——全卷积目标检测论文地址：https://arxiv.org/abs/1904.01355代码：

2021-09-01 00:51:29 2853 1

原创一点就分享系列（实践篇3-中篇）— 虽迟但到！全网首发？yolov5之“baseline修改小结“+“CV领域展开-Involution&&transformer&&cnn”

一点就分享系列（实践篇3-中篇）— 修改yolov5之”上篇心得和问题总结"||“自注意力机制的插件案例”||“大道至简-CNN模型理解”虽迟但到，首先在上篇yolov5主要基于注意力机制和特征融合的改进中，我自己也说到了提升不大或者说带来那1%的提升增加的额外算力没什么意义，这也不是上篇的初衷，上篇本质是希望大家了解yolov5的精髓并且具备动手修改网络结构以及改进的能力，和对模型的一些深度思考哈.在此基础上，我今天抛出的东西仍旧是开放性的！希望大家都能动手动脑去思考去理解，互相学习，互相交流，由于个

2021-06-04 18:22:01 19792 165

原创一点就分享系列（理解篇3）—Cv任务“新世代”之Transformer（下篇）提前“cv领域展开”——快速学习“视觉transformer的理解”+“一些吐槽”

一点就分享系列（理解篇3）Cv任务“新世代”之Transformer（下篇）——“cv领域展开”提示：本篇内容为下篇，如感兴趣可翻阅上和中篇！理解篇3 上 transformer-导读理解理解篇3 中 transformer-cv应用但是由于transformer的进展惊人的快，故此系列还会继续若干篇文章目录一点就分享系列（理解篇3）Cv任务“新世代”之Transformer（下篇）——“cv领域展开”DETR:"领域展开 Deformable!"一、"抛砖引玉"——分享下我熟悉的trick二

2021-05-06 18:07:43 3931 1

原创 Deepstream系列～Deepstream_CenterFace 5.1版本~祝你丝滑部署

Deepstream_CenterFace最近身心巨累，算法篇一直没更，分享点工程把。原因是没怎么学习新知识且transformer系列更新产出之快，主要还是都在工程任务上，今天分享下deepstream5.1 适配centerface 丝滑版本部署，无需踩坑，我把这个工程添加进了我的deepstream git. 喜欢给star谢谢，任何部署问题随时交流!my github:Deepstream_CenterFace文章目录Deepstream_CenterFaceDeepstream5.1 友

2021-04-14 20:41:01 1196 1

原创复习笔记——BN基础”回炉“，我所熟悉的BN知识

复习笔记——BN基础算法”回炉“复习笔记——基础为王，回顾基础，搞扎实是很有必要的，今天我抱着复习的目的和大家分享我理解的BN层，如有错误，欢迎批评指正以及补充.文章目录复习笔记——BN基础算法”回炉“BN一、Batch Normalization二、默写下公式和代码1. 手写公式2.torch 的BN3.跨卡BN问题4.关于我知道的BN trick三、总结BN效果BNBatch Normalization是CNN中必备操作，在代码中是耦合于卷积和激活函数操作的，那么它的出现是为了解决深层

2021-03-24 19:04:22 1371 3

原创复习笔记——动手开撸“完美”IOU计算C++版本全家桶

复习笔记——动手撸IOU全家桶（C++版本）最近需要调整下，故开此系列复习下基础，有些大厂面试会让你手撕IOU，这里我自己整理思路，编了一套C++版本的IOU礼包，该篇简单粗暴，不和你讲道理（您只需要关注我，免费获取）目的是自己造下轮子同时复习下基础知识，校招的同学们看完了可以直接反手打一个暴击，告诉面试的我不仅会IOU，我还给你写GIOU,CIOU,DIOU ！动机：分享和自己复习，主要是算法分享系列写起来太累，有时候细节知识点我真的生疏或者理解没到位，需要再反复琢磨下！晚些更。文章目录复习笔记—

2021-03-16 20:46:55 3065 7

原创一点就分享系列（实践篇3-上篇）— 修改YOLOV5 之”魔刀小试“+ Trick心得分享+V5精髓部分源码解读

一点就分享系列（实践篇3—上篇）—“全网首发” 正确手法修改YOLOV5 魔刀小试+ Trick心得分享现在部署大热，而我觉得回归原理和源码更加重要！在检测领域YOLOV5肯定是大家的炼丹必备模型，收敛快，精度高都是其爱不释手的理由，各种魔改基础backone或者别的trcik也层出不穷，这里我自己针对V5的head添加了ASFF自适应的特征融合检测层，分享下，也顺手告诉大家如何以正规的手法去修改YOLOV5的网络结构！文章目录一点就分享系列（实践篇3—上篇）—“全网首发” 正确手法修改YOLOV5

2021-03-09 12:14:39 36659 346

原创一点就分享系列（理解篇3）—Cv任务“新世代”之Transformer系列（中篇-视觉模型篇DETR初代版本）

一点就分享系列（理解篇3）—Cv任务“新世代”之Transformer系列（下篇-视觉模型篇）对于上篇介绍transformer得原理，自认为把细节讲得很详细了，作为“前菜”还算满意，这篇言归正传，先介绍最近的transform视觉工作。提示：在进行这篇阅读的时候，请务必把上篇导读详细阅读，需要你理解清晰transformer的模块结构！transfomer从原理到细节———传送门补课！文章目录一点就分享系列（理解篇3）—Cv任务“新世代”之Transformer系列（下篇-视觉模型篇）模型1—

2021-02-22 18:37:40 2199 1

原创一点就分享系列（理解篇3）—Cv任务“新世代”之Transformer系列（上篇-通俗详细导读篇）

一点就分享系列（理解篇3）—Cv“新世代”之Transformer系列（上篇-导读）提示：一点就分享系列最近，在目标检测系列如sparse-rcnn,OneNet等论文模型让人眼前一亮，而另一方面，transformer在图像上的应用也让人不能忽视，故在此之前，需要理解透彻这个算法，该篇就以transformer以其CV模型系列开启视觉任务的“新篇章”。提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一点就分享系列（理解篇3）—Cv“新世代”之Transformer系列（

2021-01-11 22:32:08 3345

原创一点就分享系列（理解篇_4+实践篇_2）”干货-全网最简且全”的理解！2020年了！您只知道GAN？ECCV超分论文“IRN” 全家桶大放送！！

一点就分享系列（理解篇_4）”最新干货”——2020 ECCV 超分论文之一“IRN”理解篇3 就是想讲网络设计，因时间原因我还需要理解学习，故先来点不一样的东西，偶然看到相关资料，本来想更理解篇3的，但是实在是非常兴奋！没忍住，连夜爆肝最速更新！！！！！！所以。。都2020了，您不会只知道“GAN”“VAE”把？没关系，最短时间让你看明白这个论文！！文章目录一点就分享系列（理解篇_4）”最新干货”——2020 ECCV 超分论文之一“IRN”IRN“背景调查”一、流模型本质解密！二、坚定信念

2020-11-20 12:46:36 2788 2

原创一点就分享系列（理解篇_2）以YOLOv3简述通用检测之道！！——“打通你检测的任督二脉 ” ”

一点就分享系列（理解篇_3）以YOLOv3简述通用检测之道！！——“老生常谈 ”一点就分享系列（理解篇_3）以YOLOv3简述通用目标检测之道！！——“老生常谈 ”文章目录一点就分享系列（理解篇_3）以YOLOv3简述通用检测之道！！——“老生常谈 ”前言一、CNN的直接输出结果二、使用步骤1.引入库2.读入数据总结前言该篇目的是为了给正在学目标检测和还不够理解网络流程的朋友扫个“盲”，顺便水一贴！言归正传。。。大家都知道目标检测器输出的结果是BOX的信息，可以框出原图展示出ROI位置，类别和

2020-11-18 20:18:15 1014 1

原创一点就分享系列（实践篇）“大概率是全网首发”——文字检测（OCR系列）之后处理：文本构造线算法（OpenCv ）版本 “为部署而生”！！！

一点就分享系列（实践篇）“全网首发”——目边检测（OCR系列）之后处理文本构造算法（OpenCv ）版本 “为部署而生”！！！想了很久要不要发，因为这是曾经的工作，对于文本线构造的每一步我已经淡忘了，所以改为实践篇，主要开源分享下代码，该接口是我用C++的opencv去特意”改装了“，原因主要是由于自己的工程版本数据结构和库耦合度太高，不易移植，小程分享源于对算法的热爱，代码改的仓促称不上完美，但是可以移植去调节阈值使用，主要为了OCR检测部分的部署应用。提示：写完文章后，目录可以自动生成，如何生

2020-11-17 17:55:55 1001 2

原创一点就分享系列（理解篇）浅析CV中的1x1卷积的“前世今生”

第一次写分享系列，先来个入门级别，就叫一点就分享了，啥都会一点的小程先来一篇，后续会有工程实践篇，原创且干货！

2020-11-16 17:26:40 1970 10

啥都会一点的小程的博客