自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

二分掌柜的

二分掌柜的

  • 博客(1533)
  • 资源 (34)
  • 收藏
  • 关注

原创 深度学习 目标分类 目标检测 多目标跟踪 基础 进阶

flyfish

2024-09-07 08:37:15 2194 2

原创 大模型系列

flyfish

2024-09-06 17:20:29 1079

原创 知识蒸馏 Knowledge Distillation- MLE(Maximum Likelihood Estimation,极大似然估计)中 极大 的含义是什么

flyfish

2025-08-25 18:53:28 636

原创 知识蒸馏 Knowledge Distillation - MLE(Maximum Likelihood Estimation,极大似然估计)是什么

flyfish

2025-08-25 18:51:05 486

原创 知识蒸馏 Knowledge Distillation - 似然函数的形式为什么是这个样子

flyfish

2025-08-25 18:49:39 271

原创 知识蒸馏 Knowledge Distillation 1. 监督式微调(SFT):极大似然是前向 KL 的特例

flyfish

2025-08-24 21:56:52 500

原创 知识蒸馏 Knowledge Distillation 0. 基础:自回归分解与逐 token散度

flyfish

2025-08-24 11:46:29 411

原创 知识蒸馏 Knowledge Distillation 序列的联合概率 分解成 基于历史的条件概率的连乘序列

flyfish

2025-08-23 22:15:08 828

原创 知识蒸馏 Knowledge Distillation 概率链式法则(Probability Chain Rule)

flyfish

2025-08-23 21:51:42 792

原创 图结构使用 Louvain 社区检测算法进行分组

flyfish

2025-08-23 11:37:01 869

原创 Depth-First Search 深度优先搜索 和 Breadth-First Search 广度优先搜索

flyfish

2025-08-23 11:35:52 804

原创 知识蒸馏 Knowledge Distillation 乘法法则、全概率公式、贝叶斯定理

flyfish

2025-08-22 20:11:27 1043

原创 知识蒸馏 Knowledge Distillation 联合概率、条件概率、边缘概率

flyfish

2025-08-22 20:10:01 804

原创 知识蒸馏 Knowledge Distillation 论文 Generalized Knowledge Distillation (GKD) 目标函数的演化

flyfish

2025-08-22 20:08:55 618

原创 知识蒸馏(KD)代码实现

flyfish

2025-08-20 18:46:29 668

原创 有向图(Directed Graph)和有向无环图(Directed Acyclic Graph,DAG)代码实践

flyfish

2025-08-20 18:45:50 785

原创 给类或实例打上标识即类的元数据标签方便程序在运行时对其进行分类、识别、筛选

flyfish

2025-08-19 20:11:14 306

原创 懒加载机制实现子模块按需动态导入

flyfish

2025-08-19 20:10:31 1021

原创 知识蒸馏 Jensen-Shannon散度

flyfish

2025-08-18 19:46:51 972

原创 知识蒸馏 - 各类概率分布

flyfish

2025-08-18 19:46:00 753

原创 基于 LoRA的广义知识蒸馏(GKD)训练

flyfish

2025-08-16 22:00:34 215

原创 Gemma 3 多模态推理 通过vllm运行Gemma-3-27B-IT模型的推理服务

flyfish

2025-08-14 18:26:00 501

原创 低配硬件运行智谱GLM-4.5V视觉语言模型推理服务的方法

flyfish

2025-08-14 18:24:22 663

原创 Gemma 3 报告中的蒸馏

flyfish

2025-08-13 17:23:16 807

原创 Qwen3 技术报告 的 Strong-to-Weak Distillation 强到弱蒸馏 和 代码实现

flyfish

2025-08-13 11:52:56 1699

原创 过拟合、欠拟合与方差/偏差的关系

flyfish

2025-08-12 19:38:05 720

原创 一个基于 PyTorch 的完整模型训练流程

flyfish

2025-08-12 18:49:07 669

原创 TRL - Transformer Reinforcement Learning 传递给SFTTrainer的数据集

flyfish

2025-08-11 19:52:29 718

原创 TRL - Transformer Reinforcement Learning SFTTrainer 和 SFTConfig

flyfish

2025-08-11 19:28:41 753

原创 大模型训练的语法模拟 accelerate 主命令(main command), launch 子命令(subcommand)

flyfish

2025-08-10 12:28:35 409

原创 知识蒸馏 - 大语言模型知识蒸馏LLM-KD-Trainer 源码分析 数据集处理

flyfish

2025-08-09 12:34:56 783

原创 知识蒸馏 - 大语言模型知识蒸馏LLM-KD-Trainer 源码分析 KnowledgeDistillationTrainer类

flyfish

2025-08-09 12:27:22 762

原创 知识蒸馏 - 基于KL散度的知识蒸馏 KL散度的方向

flyfish

2025-08-07 20:08:42 1501

原创 Python 位置参数(positional arguments)

flyfish

2025-08-07 20:06:50 811

原创 微调训练时,ignore_empty_think是怎么保护模型的思考能力?

flyfish

2025-08-06 19:22:52 607

原创 在对 Qwen3 进行微调训练时,如何保护模型的思考能力?

在使用不包含思考过程的数据集进行模型微调时,为避免模型因过度学习 “直接输出答案” 的模式而丢失深层思考能力,本文从数据结构和训练策略层面减少对思考能力的破坏。

2025-08-06 15:19:14 1298

原创 知识蒸馏 - 视觉模型知识蒸馏Vision-KD-Trainer KL散度公式变化

flyfish

2025-08-04 19:55:30 996

原创 中文基于Qwen3-235B-2507蒸馏数据集的操作

flyfish

2025-08-04 19:54:55 890

原创 知识蒸馏 - 视觉模型知识蒸馏Vision-KD-Trainer 采用PyTorch 内置函数F.kl_div的实现方式

flyfish

2025-08-03 15:03:40 285

原创 知识蒸馏 - 视觉模型知识蒸馏Vision-KD-Trainer 代码中KL散度公式 为什么 dim=-1

flyfish

2025-08-03 14:42:51 990

Tree control的使用

Tree Control的单击响应 只遍历根节点,非递归遍历具有两层目录的节点 递归遍历所有节点

2010-11-29

List Control 可编辑任意item文本,设置行高

List Control 可编辑任意item文本,设置行高 使用Owner Draw实现List Control的重绘

2010-11-22

限制Edit Control输入的字符

限制Edit Control的输入字符,只允许输入字母和数字。控件子类化.

2010-11-20

vc实现时间延时 延时时间 包括 秒 毫秒 微秒

用Sleep函数延时,如何时间太长,程序就像无响应一样,采用消息泵可以解决这个问题 延时 时间 包括 秒 毫秒 微秒

2010-11-13

MFC下实现SOAP服务端和SOAP客户端

MFC下实现SOAP服务端和SOAP客户端

2012-05-14

leveldb-windows

Windows下编译LevelDB 环境:windows x64 编译器: VC2010

2015-07-08

单击按钮在固定位置创建子窗口,单击父窗口的时自动隐藏子窗口.

单击按钮在固定位置创建子窗口,单击父窗口的时自动隐藏子窗口

2010-12-07

C++实现的BOSN bson-cpp的编译

C++实现的BOSN bson-cpp的编译

2015-07-24

boost log 简单使用

环境 vc2010 MFC Unicode

2014-11-08

在固定位置创建子窗口,点击父窗口自动隐藏子窗口

在固定位置创建子窗口,点击父窗口自动隐藏子窗口

2010-12-08

创建ED2K链接源代码

创建ED2K链接源代码,学习eMule不错的代码

2009-01-08

C++ 开发SOAP服务端和SOAP客户端

利用gSOAP自带的Calc例子 仿写一个 网络中使用计算器 客户端发送需要操作的数据,服务端计算完之后,将结果返回给客户端 编写之后 我们的服务端可独立使用。像在安装了IIS或者用Apache配置的Web服务器。

2012-05-14

CString与其他数据类型的转换

CString与其他数据类型的转换 包括char*,COLOREF,16进制,格式化字符串,将字符串分解为子串等

2010-11-04

List Control可编辑item文本(只支持第一列)

List Control可编辑item文本(只支持第一列)

2010-11-19

VC中使用ATL编写控件

VC中使用ATL编写控件 vc2005编译通过

2010-10-29

软件架构及设计 台湾-高焕堂

软件架构及设计 台湾-高焕堂 比较好的资料

2009-01-08

gloox即时通讯编程

这其中包含即时通讯编程(二)文章中提到中的类,还有三个release 版的lib

2009-05-30

懒加载机制实现子模块按需动态导入

懒加载机制实现子模块按需动态导入

2025-08-19

大模型训练的语法模拟 accelerate 主命令(main command), launch 子命令(subcommand) Accelerate 是 Hugging Face 推出的一个轻量级库

大模型训练的语法模拟 accelerate 主命令(main command), launch 子命令(subcommand) Accelerate 是 Hugging Face 推出的一个轻量级库

2025-08-10

boost-1820-ndk25-api28

boost_1820_ndk25_api28

2023-08-09

boost-1-82-0-for-android

ndk25 api24 编译 boost boost_1_82_0

2023-08-07

NDK25 API28 curl

NDK25 API28 curl

2023-08-01

ncnn vulkan x86-64下的使用 完整源码

ncnn vulkan x86_64下的使用 完整源码

2023-07-14

Vulkan ,编译ffmpeg 硬件加速时使用

Vulkan ,编译ffmpeg 硬件加速时使用

2023-07-05

single-producer, single-consumer lock-free queue

single-producer, single-consumer lock-free queue

2023-06-29

ncnn vulkan 以类的方式推理示例

https://flyfish.blog.csdn.net/article/details/131323138

2023-06-21

CEF使用示例

CEF使用示例

2016-05-23

Agg在Windows下的编译 字符集 Unicode

Agg在Windows下的编译与使用 AGG(Anti-Grain Geometry)是一个开源免费的图形库。 官网地址: www.antigrain.com 环境: Win10 x64 Visual Studio 2013 字符集 Unicode 主要是编译称为Lib库,然后提供给其他程序使用

2017-12-27

MFC中使用duilib

MFC中使用duilib MFC为框架,以duilib美化界面 MFC窗口是父窗口,duilib窗口作为其子窗口

2017-10-18

grpc编译安装所需文件

grpc所需文件包括benchmark-master.zip googletest-master.zip thrift-master.zip c-ares-1.14.0.tar.gz grpc-master.zip zlib-master.zip gflags-master.zip protobuf-master.zip

2018-07-31

TensorFlow inception-2015-12-05.tgz

TensorFlow inception-2015-12-05.tgz 该压缩包 包含 classify_image_graph_def.pb imagenet_2012_challenge_label_map_proto.pbtxt 等

2017-09-18

bson-cpp的编译

编译环境: VC2010 64位 需要配置Boost库

2015-07-31

Duilib的设计工具DuiDesigner

Duilib的设计工具DuiDesigner 包括源码 方便设计 已在vs2013下编译通过

2017-10-19

一个曾经商业化的MFC library Ultimate Grid 现在免费提供

一个曾经商业化的MFC library Ultimate Grid 现在免费提供 原文的demo 的字符集是多字节的,现在更改为 使用Unicode字符集 平台工具集更改为 Visual Studio 2013 - Windows XP(v120_xp)

2017-10-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除