自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(206)
  • 收藏
  • 关注

原创 【论文精读】Transformer: Attention Is All You Need 注意力机制就是一切

【论文精读】Transformer: Attention Is All You Need 注意力机制就是一切

2025-12-17 15:27:04 1015

原创 【多模态大模型】Qwen-VL 系列多模态大模型详解:从 Qwen-VL 到 Qwen2.5-Omni 的全面解析

【多模态大模型】Qwen-VL 系列多模态大模型详解:从 Qwen-VL 到 Qwen2.5-Omni 的全面解析

2025-10-17 00:12:09 1535

原创 【图像大模型】ms-swift 深度解析:一站式多模态大模型微调与部署框架的全流程使用指南

ms-swift 深度解析:一站式多模态大模型微调与部署框架的全流程使用指南

2025-10-17 00:03:04 2344

原创 【计算机视觉】SAM 3 技术深潜:从“分割万物”到“理解概念”的范式转移

【计算机视觉】SAM 3 技术深潜:从“分割万物”到“理解概念”的范式转移

2025-10-16 23:39:01 1102

原创 【论文精读】OAgents: An Empirical Study of Building Effective Agents

【论文精读】OAgents: An Empirical Study of Building Effective Agents

2025-09-12 00:58:23 1257

原创 【论文精读】Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use

Synthetic Data Generation & Multi-Step RL for Reasoning & Tool Use

2025-09-12 00:51:36 1012

原创 【论文精读】Research and Design of Intelligent Parking Management System Based on the YOLO Algorithm

基于 YOLO 算法的智能停车管理系统的研究与设计- Research and Design of Intelligent Parking Management System Based on the YOLO Algorithm

2025-09-01 23:33:28 1116

原创 【论文精读】基于YOLOv3算法的高速公路火灾检测

【论文精读】基于YOLOv3算法的高速公路火灾检测

2025-09-01 23:24:14 1422 2

原创 【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING

【论文精读】 PVPO: PRE-ESTIMATED VALUE-BASED POLICY OPTIMIZATION FOR AGENTIC REASONING

2025-09-01 23:17:21 1011

原创 【大模型LLM】大模型训练加速 - 模型并行(Model Parallelism)原理详解

大模型训练加速 - 模型并行(Model Parallelism)原理详解

2025-08-02 09:41:58 491

原创 【大模型LLM】大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解

大模型训练加速 - 深度混合精度训练(Mixed Precision Training)原理详解

2025-08-02 09:35:29 634

原创 【大模型LLM】大模型训练加速 - 数据并行(Data Parallelism, DP)原理详解

大模型训练加速-数据并行(Data Parallelism, DP)原理详解

2025-08-02 09:30:39 1191

原创 【大模型LLM】大模型训练加速 - 梯度累积(Gradient Accumulation)原理详解

大模型训练加速 - 梯度累积(Gradient Accumulation)原理详解

2025-07-28 18:36:10 1280

原创 【大模型LLM】大模型微调 应对显存限制和训练加速 常用的优化策略

大模型微调 应对显存限制和训练加速 常用的优化策略

2025-07-28 17:37:54 1229

原创 【大模型LLM】大模型微调训练的过程中 怎么在保留基模的知识能力的基础上 提升模型在微调数据集上的表现

大模型微调训练的过程中 怎么在保留基模的知识能力的基础上 提升模型在微调数据集上的表现

2025-07-14 22:36:17 939

原创 【大模型LLM】 Megatron-LM 大模型训练框架吞吐率计算&吞吐率优化策略

Megatron-LM 大模型训练框架吞吐率计算&吞吐率优化策略

2025-07-06 23:37:10 1295

原创 【大模型LLM】GPU计算效率评估指标与优化方法:吞吐率

GPU计算效率评估指标与优化方法:吞吐率

2025-07-06 22:06:16 1521

原创 【深度学习】条件随机场(CRF)深度解析:原理、应用与前沿

条件随机场(CRF)深度解析:原理、应用与前沿

2025-06-19 23:41:02 1259

原创 【深度学习】生成对抗网络(GANs)深度解析:从理论到实践的革命性生成模型

生成对抗网络(GANs)深度解析:从理论到实践的革命性生成模型

2025-06-19 23:19:29 1021

原创 【深度学习】循环神经网络(RNN):序列建模的奠基者

循环神经网络(RNN):序列建模的奠基者

2025-06-19 23:01:41 1010

原创 【深度学习】卷积神经网络(CNN):计算机视觉的革命性引擎

卷积神经网络(CNN):计算机视觉的革命性引擎

2025-06-19 00:01:42 1404

原创 【文本大模型】从0开始 - 本地部署一个ChatGLM对话模型(基于WebUI)

从0开始 - 本地部署一个ChatGLM对话模型(基于WebUI)

2025-06-18 23:50:09 1426

原创 【深度学习】TensorFlow全面指南:从核心概念到工业级应用

TensorFlow全面指南:从核心概念到工业级应用

2025-06-17 23:46:35 1457 3

原创 【深度学习】深度学习入门:从理论到实践的全面指南

深度学习入门:从理论到实践的全面指南

2025-06-17 23:29:32 1334

原创 【大模型】LLM 基础面试题 - LLM最全知识点合集

LLM 基础面试题 - LLM最全知识点合集

2025-06-16 22:43:58 708

原创 【推荐算法】DIEN:阿里揭秘用户兴趣演化的深度时间序列模型

DIEN:阿里揭秘用户兴趣演化的深度时间序列模型

2025-06-16 22:12:33 1402

原创 【大模型】LLM 基础面试题合集 - LLM最全八股和答案(四)

LLM 基础面试题合集 - LLM最全八股和答案(四)

2025-06-16 21:57:03 1044

原创 【推荐算法】强化学习:让推荐系统像智能机器人一样自主学习

强化学习:让推荐系统像智能机器人一样自主学习

2025-06-16 00:15:28 1539 1

原创 【推荐算法】注意力机制与兴趣演化:推荐系统如何抓住用户的心?

注意力机制与兴趣演化:推荐系统如何抓住用户的心?

2025-06-13 00:41:18 1115

原创 【大模型】LLM 基础面试题合集 - LLM最全八股和答案(三)

LLM 基础面试题合集 - LLM最全八股和答案(三)

2025-06-13 00:30:39 1278

原创 【推荐算法】Deep Crossing:端到端深度推荐系统的奠基者

Deep Crossing:端到端深度推荐系统的奠基者

2025-06-08 14:19:50 1020

原创 【推荐算法】推荐算法演进史:从协同过滤到深度强化学习

推荐算法演进史:从协同过滤到深度强化学习

2025-06-08 00:03:48 1254

原创 【大模型】LLM 基础面试题合集 - LLM最全八股和答案(二)

LLM 基础面试题合集 - LLM最全八股和答案(二)

2025-06-07 23:31:31 982

原创 【大模型】LLM 基础面试题合集 - LLM最全八股和答案(一)

LLM 基础面试题合集 - LLM最全八股和答案(一)

2025-06-07 22:55:06 891

原创 【大模型】Transformer 最全面试题 合集(一)

Transformer面试题 合集(一)

2025-06-07 22:15:57 996

原创 【大模型】大模型RAG(Retrieval-Augmented Generation)面试题合集

大模型RAG(Retrieval-Augmented Generation)面试题合集

2025-06-07 18:18:13 887

原创 【推荐算法】DeepFM:特征交叉建模的革命性架构

DeepFM:特征交叉建模的革命性架构

2025-06-06 22:13:17 1570 1

原创 【推荐算法】NeuralCF:深度学习重构协同过滤的革命性突破

NeuralCF:深度学习重构协同过滤的革命性突破

2025-06-06 00:25:27 1108

原创 【推荐算法】Wide&Deep推荐模型:融合记忆与泛化的智能推荐引擎

Wide&Deep推荐模型:融合记忆与泛化的智能推荐引擎

2025-06-06 00:00:41 1854 1

原创 【推荐算法】Embedding+MLP:TensorFlow实现经典深度学习推荐模型详解

Embedding+MLP:TensorFlow实现经典深度学习推荐模型详解

2025-06-04 23:56:57 1415

维表-节假日维表-未来50年节假日coding表-dim

人工coding的未来50年每天的节日、假日标签,维度表,用于建模时的日期标注

2025-05-20

壁纸-鬼刀-全套壁纸/电脑壁纸/桌面壁纸

壁纸-鬼刀-全套壁纸/电脑壁纸/桌面壁纸

2025-05-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除