- 博客(206)
- 收藏
- 关注
原创 【论文精读】Transformer: Attention Is All You Need 注意力机制就是一切
【论文精读】Transformer: Attention Is All You Need 注意力机制就是一切
2025-12-17 15:27:04
1015
原创 【多模态大模型】Qwen-VL 系列多模态大模型详解:从 Qwen-VL 到 Qwen2.5-Omni 的全面解析
【多模态大模型】Qwen-VL 系列多模态大模型详解:从 Qwen-VL 到 Qwen2.5-Omni 的全面解析
2025-10-17 00:12:09
1535
原创 【图像大模型】ms-swift 深度解析:一站式多模态大模型微调与部署框架的全流程使用指南
ms-swift 深度解析:一站式多模态大模型微调与部署框架的全流程使用指南
2025-10-17 00:03:04
2344
原创 【计算机视觉】SAM 3 技术深潜:从“分割万物”到“理解概念”的范式转移
【计算机视觉】SAM 3 技术深潜:从“分割万物”到“理解概念”的范式转移
2025-10-16 23:39:01
1102
原创 【论文精读】OAgents: An Empirical Study of Building Effective Agents
【论文精读】OAgents: An Empirical Study of Building Effective Agents
2025-09-12 00:58:23
1257
原创 【论文精读】Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use
Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use
2025-09-12 00:51:36
1012
原创 【论文精读】Research and Design of Intelligent Parking Management System Based on the YOLO Algorithm
基于 YOLO 算法的智能停车管理系统的研究与设计- Research and Design of Intelligent Parking Management System Based on the YOLO Algorithm
2025-09-01 23:33:28
1116
原创 【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING
【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING
2025-09-01 23:17:21
1011
原创 【大模型LLM】大模型训练加速 - 模型并行(Model Parallelism)原理详解
大模型训练加速 - 模型并行(Model Parallelism)原理详解
2025-08-02 09:41:58
491
原创 【大模型LLM】大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解
大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解
2025-08-02 09:35:29
634
原创 【大模型LLM】大模型训练加速 - 数据并行(Data Parallelism, DP)原理详解
大模型训练加速-数据并行(Data Parallelism, DP)原理详解
2025-08-02 09:30:39
1191
原创 【大模型LLM】大模型训练加速 - 梯度累积(Gradient Accumulation)原理详解
大模型训练加速 - 梯度累积(Gradient Accumulation)原理详解
2025-07-28 18:36:10
1280
原创 【大模型LLM】大模型微调训练的过程中 怎么在保留基模的知识能力的基础上 提升模型在微调数据集上的表现
大模型微调训练的过程中 怎么在保留基模的知识能力的基础上 提升模型在微调数据集上的表现
2025-07-14 22:36:17
939
原创 【大模型LLM】 Megatron-LM 大模型训练框架吞吐率计算&吞吐率优化策略
Megatron-LM 大模型训练框架吞吐率计算&吞吐率优化策略
2025-07-06 23:37:10
1295
原创 【文本大模型】从0开始 - 本地部署一个ChatGLM对话模型(基于WebUI)
从0开始 - 本地部署一个ChatGLM对话模型(基于WebUI)
2025-06-18 23:50:09
1426
原创 【大模型】大模型RAG(Retrieval-Augmented Generation)面试题合集
大模型RAG(Retrieval-Augmented Generation)面试题合集
2025-06-07 18:18:13
887
原创 【推荐算法】Embedding+MLP:TensorFlow实现经典深度学习推荐模型详解
Embedding+MLP:TensorFlow实现经典深度学习推荐模型详解
2025-06-04 23:56:57
1415
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
2