- 博客(266)
- 收藏
- 关注
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2
2025-12-31 23:27:35
777
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 16: Alignment - RL 1
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 16: Alignment - RL 1
2025-12-28 10:23:05
619
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 15: Alignment - SFT/RLHF
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 15: Alignment - SFT/RLHF
2025-12-21 14:27:55
890
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 14: Data 2
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 14: Data 2
2025-12-14 10:08:17
861
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 13: Data 1
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 13: Data 1
2025-12-07 14:42:20
856
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 12: Evaluation
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 12: Evaluation
2025-11-30 10:40:32
978
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 11: Scaling laws 2
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 11: Scaling laws 2
2025-11-23 10:36:24
954
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 10: Inference
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 10: Inference
2025-11-23 10:36:04
1242
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 9: Scaling laws 1
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 9: Scaling laws 1
2025-11-16 10:37:24
1195
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 8: Parallelism 2
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 8: Parallelism 2
2025-11-09 11:11:06
920
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 7: Parallelism 1
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 7: Parallelism 1
2025-11-04 22:29:14
1122
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 6: Kernels,Triton
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 6: Kernels,Triton
2025-10-26 21:00:19
1351
1
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 5: GPUs
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 5: GPUs
2025-10-19 22:43:04
572
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 4: Mixtrue of experts
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 4: Mixtrue of experts
2025-10-19 22:40:53
866
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 3: Architectures,Hyperparameters
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 3: Architectures,Hyperparameters
2025-10-12 14:24:58
1675
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 2: Pytorch,Resource Accounting
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 2: Pytorch,Resource Accounting
2025-09-21 16:12:54
1523
1
原创 斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 1: Overview and Tokenization
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 1: Overview and Tokenization
2025-09-21 16:11:21
2278
2
原创 Qwen2.5-VL源码解读-Qwen2VLImageProcessor
Qwen2.5-VL源码解读-Qwen2VLImageProcessor
2025-09-14 09:33:30
2636
2
原创 Qwen2.5-VL源码解读-图片预处理process_vision_info
Qwen2.5-VL源码解读-图片预处理process_vision_info
2025-09-14 09:32:03
2663
3
原创 Agent 的概念、原理与构建模式 — 从零打造一个简化版的 Claude Code
Agent 的概念、原理与构建模式 — 从零打造一个简化版的 Claude Code
2025-09-07 16:35:30
1419
原创 【CUDA进阶】MMA分析Bank Conflict与Swizzle(下)
【CUDA进阶】MMA分析Bank Conflict与Swizzle(下)
2025-08-30 20:28:54
1550
6
原创 【CUDA进阶】MMA分析Bank Conflict与Swizzle(上)
【CUDA进阶】MMA分析Bank Conflict与Swizzle(上)
2025-08-30 20:27:44
1692
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅