a flying bird-CSDN博客

转载 GRPO 算法核心公式解析（附代码详解）

【代码】GRPO 算法核心公式解析（附代码详解）

2026-01-03 09:47:54 156 1

转载大模型训练方法：GRPO 和 GSPO

https://murphypei.github.io/blog/2025/11/grpo-gspo.htmlhttps://murphypei.github.io/blog/2025/11/grpo-gspo.html

2026-01-02 11:23:06 60

转载 PyTorch FSDP：高效分布式训练数十亿参数大模型

PyTorch FSDP 是一个功能强大且灵活的分布式训练框架，它通过对模型参数、梯度和优化器状态的完全分片，成功地突破了单卡显存的壁垒，成为训练数十亿乃至更大规模模型的关键技术。为了获得更好的性能，我们需要对模型内部的子模块（例如 Transformer 的每一层）应用 FSDP 包装，形成嵌套的 FSDP 实例。在许多场景下，利用已经训练好的、强大的基础模型进行微调或直接通过 API 调用，是更具经济效益和效率的选择。但是，它的性能和显存效率还不是最优的，因为整个模型被视为一个巨大的 FSDP 单元。

2025-12-23 23:15:07 135

原创 LLM原理训练推理详解

特点单轮QA Q1 Q2 A1 A2 A3多轮QA Q1 A1 Q2 A2 Q3 A3目的模型仅需理解单个问题的答案模型需要在多轮对话中保持上下文问题与答案结构问题和答案交替存在每一轮的提问和回答交替存在上下文没有上下文依赖，每个问题独立每一轮的对话都依赖前面的内容，必须保持上下文示例模型任务生成单个问题的答案生成多轮对话中的每轮答案。_llm预测下一个词时需要用strat标签吗。LLM原理训练推理详解_llm预测下一个词时需要用strat标签吗-CSDN博客。

2025-07-20 16:56:58 288

原创 LLM实战之Mistral 7B指令微调

https://zhuanlan.zhihu.com/p/699300591

2025-07-20 14:28:55 199

转载 Encoder和Decoder的胜负之分

https://zhuanlan.zhihu.com/p/1898887042483614519https://zhuanlan.zhihu.com/p/1898887042483614519

2025-05-18 17:28:16 108

转载 Layer-Norm、Batch-Norm与RMS-Norm计算过程

https://zhuanlan.zhihu.com/p/2288665835https://zhuanlan.zhihu.com/p/2288665835

2025-05-18 17:26:45 87

原创昇腾 msmodelslim w8a8量化代码解析

最近有很多朋友都在部署deepseek模型，而且都用到了模型量化这个功能，目的是减少显存占用、提升推理速度。量化算法流程上图是算法流程，主要包含4步：①，使用昇腾 msmodelslim 仓库提供的量化接口对原始模型权重进行量化，生成int8格式的权重文件，以及后续在推理的时候要用到的激活值的量化参数和 matmul 结果的反量化参数；②，推理执行过程中，把Matmul的激活值（也就是输入X）进行int8量化；昇腾 msmodelslim w8a8量化代码解析_昇腾模型量化-CSDN博客。

2025-04-20 09:39:19 505

原创大模型集合网站huggingface使用技巧

【代码】大模型集合网站huggingface使用技巧。

2024-11-21 22:18:03 325

原创 mindspore发布件

MindSpore Repohttps://repo.mindspore.cn/MindSpore Repohttps://repo.mindspore.cn/mindspore-lab/mindnlp/newest/any/

2024-11-15 19:48:32 305

原创 GOOGLENET V4

3个3*3的卷积相当于一个7*7的卷积。

2024-07-23 22:15:02 209

原创 SENET

2024-07-03 08:21:14 260

原创 YOLOV3

416 /8 =52。

2024-06-25 07:17:34 238

原创 Resnet论文阅读

2024-06-18 07:35:01 216

原创人脸识别算法

2024-06-07 08:44:57 204

原创神经网络画图工具

1. PPT。

2024-06-05 22:19:16 344

原创 mobileNet网络

一层的普通卷积 + 13层的深度可分离卷积 + 一个全连接 = 1 + 13 *2 + 1 = 28。

2024-05-31 07:26:58 231

原创 VGG论文精读

2. 作为各类图像任务的骨干网络结构：分类、定位、检测、分割一系列图像任务大都有VGG为骨干。2. 作为各类图像任务的骨干网络结构：分类、定位、检测、分割一系列图像任务大都有VGG为骨干。2. 作为各类图像任务的骨干网络结构：分类、定位、检测、分割一系列图像任务大都有VGG为骨干。1. 开启小卷积核时代：3*3卷积核成为主流模型。1. 开启小卷积核时代：3*3卷积核成为主流模型。1. 开启小卷积核时代：3*3卷积核成为主流模型。1. 结构简洁，推理效率高，作为backbone。

2024-05-17 08:25:39 313

原创 Albumentations——广泛应用于工业界、学术界、AI竞赛和开源项目中的CV数据增强工具

Albumentations: fast and flexible image augmentationsDiscover Albumentations: an open-source library offering efficient and customizable image augmentations to boost machine learning and computer vision model performance.https://albumentations.ai/GitHub -

2024-03-14 07:18:40 1019

原创图像分割损失函数

为什么要乘以2，是为了让DICE的值域在0和1之间。

2024-03-13 07:31:21 503

原创最优学习率寻找

深度神经网络使用随机梯度下降和可微分的误差向后传递更新神经网络中所有的可训参数 (trainable parameters \theta )，从而学到一个层级化的表示，此表示相当于一个函数 f，能近似的将输入 x 映射到输出 y, 即 f(…Keras 实现最优学习率寻找（LR Range Test) - 知乎。

2024-03-13 07:13:22 521

原创【调参】如何为神经网络选择最合适的学习率lr-LRFinder-for-Keras

前言学习率lr在神经网络中是最难调的全局参数：设置过大，会导致loss震荡，学习难以收敛；设置过小，那么训练的过程将大大增加。如果，调整一次学习率的周期的训练完一次，那么，训练n次，才能得到n个lr的结果…，导致学习率的选择过程代价太大。有多种方法可以为学习速度选择一个好的起点。一个简..._学习率选择。【调参】如何为神经网络选择最合适的学习率lr-LRFinder-for-Keras_学习率选择-CSDN博客。

2024-03-12 08:25:53 611

原创 onnx模型优化利器onnxoptimizer、onnxsim

onnxoptimizer、onnxsim被誉为onnx的优化利器，其中onnxsim可以优化常量，onnxoptimizer可以对节点进行压缩。入群密码 nndab，微信群可加我的微信 daquexian 我来拉入群更新：我得到了 ONNX 项目的 approver 权限，可以 approve 和合并 ONNX 项目的 PR，之后可以有更大的能力帮助 ONNX 的…ONNX模型是一种跨平台、跨框架的模型表示格式，允许用户在不同的深度学习框架之间共享模型和数据，从而加速模型开发和部署。

2024-03-07 22:10:30 2492

原创【最强ResNet改进系列】IResNet：涨点不涨计算量，可训练网络超过3000层！

论文链接：https://arxiv.org/abs/2004.04989 代码链接：https://github.com/iduta/iresnet (10 Apr 2020)摘要残差网络(ResNets)是一种功能强大的卷积神经网络(convolutional neural network, CNN)架构，广泛应用…阅读大概需要15分钟Follow小博主，每天更新前沿干货【导读】本篇文章是【最强ResNet改进系列】的第四篇文章，前面我们已经介绍了Res2..._iresnet2060。

2024-03-07 08:14:03 1876

原创机器视觉相关网站推荐

计算机视觉（Computer Vision）最近这几年发展迅速，技术论坛和QQ群也如雨后春笋，特别是人脸检测/识别领域。机器视觉相关网站推荐 - 知乎。

2024-03-06 22:44:36 607

原创人脸检测之数据处理

1. 图片裁剪之后，要看图片质量怎么样，直接影响到最终的训练效果。比如有的人脸图片裁剪后只剩半张人脸，就应该提出这样搞的正样本图片。

2024-03-05 08:54:19 479

原创视觉基本数据和基线代码获取

1. 搜benchmark, 视觉相关的，很多行业都有自己的benchmark.

2024-03-05 08:23:38 461

原创神经网络结构搜索（NAS）

找一个神经网络结构使得此网络在验证集上的准确率（或者其他指标）最高。

2024-02-27 22:02:29 1034

原创图片数据爬取工具Image-Downloader

文章浏览阅读1.2k次。既然我们使用 Image-Downloader 这个工具进行图片搜索，相比python我们都非常熟悉，在此不在叙述，可参考其他文章。图片数据爬取工具Image-Downloader_image downloader-CSDN博客。

2024-02-27 21:51:52 904

原创使用RegNet替换YOLOX中原始的Backbone

将mmdet/models/backbones/regnet.py中相关的代码复制到YOLOX中，并进行适配。，可以通过调试后，先运行到后后端输出结果出，打印出通道数，得到通道后，在写到这个地方。RegNet bcakbones替换YOLOX中原始的Backbone。

2024-02-18 22:50:06 807

原创 OpenMMLab

OpenMMLab是深度学习时代最完整的计算机视觉开源算法体系。自2018 年开源以来，累计发布超过 20个算法库，涵盖分类、检测、分割、视频理解等众多算法领域，有超过 250 种算法实现和 2000 个预训练模型。OpenMMLab 在 GitHub 上共获得了 60,000+ star，有超过 1,300 名社区开发者参与项目开发，用户遍及全球超过 110 个国家和地区，全球顶尖的高校、研究机构和企业都在使用 OpenMMLab 进行算法研发工作，是深度学习时代极受欢迎的计算机视觉开源算法平台。

2024-02-08 07:18:23 1001

原创 imgaug数据增强神器：增强器一览

官网：https://imgaug.readthedocs.io/en/latest/文章目录一、Sequential 顺序增强器二、SomeOf 子项增强器三、OneOf 其一增强器四、Sometimes 部分增强器五、WithColorspace 附带颜色空间增强器六、WithChannels 通道增强器七、Noop 无操作增强器八、Lambda Lambda增强器九、AssertLamb..._iaa 图像增强改变颜色。

2024-02-08 07:03:53 598

原创 pytorch训练指标记录之tensoboard，wandb

wandb是Weights & Biases的缩写，是类似TensorBoard， visdom的一款可视化工具是属于Python的，不是Pytorch的https://wandb.ai/sitewandb是最大的特点是能自动上传云端，让你即使在外面或者旅行途中也能随时随地查看模型崩没崩。注册账户安装Wandb开始使用Pytorch+Wandb+argparse实现高效实验管理 Wandb简介 Wandb是一个高效的、功能丰富的人工智能实验管理平…科研工具-01 使用Wandb实现高效实验管理 - 知乎。

2024-02-07 22:19:18 1049

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

大模型微调，包括高效微调和全量微调等

大模型学习资料1，包括PEFT，微调等

大模型微调学习项目2，包括SD, llava等

LLM原理训练推理详解

LLMS面试常见题面试常见题

大模型微淘学习资料学习资料

神经网络基础知识整理RNN等

OnlineLearning_BasicAlgorithm-master.zip

FTRL_FM_LR.html

Word2Vec中的数学原理详解.pdf

minist_tensorflow_pb_train_predict.zip

train_mnist.zip

alphaFM-master.zip

空空如也