以下是关于dabochen/spreadsheet-is-all-you-need
项目的介绍:
1. 项目概述
这是一个独特的项目,将nanoGPT
管道整洁地打包在电子表格中。该项目旨在帮助作者理解GPT
的工作原理,结果是一次有趣且引人入胜的探索。
2. 项目特点
- 所有机制、计算和矩阵都是完全交互和可配置的。
- 电子表格包含所有的
transformer
组件,如嵌入、层归一化、自注意力、投影、MLP
、Softmax
和Logits
。 - 它基于
Andrej Karpathy
的NanoGPT
结构,具有约85000
个参数,足够小以易于管理,但又足够复杂以理解。 - 该系统是基于字符的预测系统,而不是通常的语言预测,只有
A/B/C
三个标记。
3. 如何使用
- 注意颜色编码的块:紫色用于替换为训练模型参数的参数,绿色用于从输入转换的值,橙色用于中间计算值。
- 从顶部开始,按照左侧的标签向下工作。有三个具有相同结构的
transformer
,标记为0/1/2
。 - 可以阅读以形成对
transformer
的视觉印象,检查每个单元格中的实际计算,观察值对其他单元格的影响,进行参数更改,或使用实际的NanoGPT
权重(如果有)。
4. 未来计划
作者提到目前还没有Excel
或Google Sheets
版本,因为管道太大,但可能会在未来添加(现在已经有Excel
版本)。
5. 特别感谢
最后,作者特别感谢Andrej Karpathy
的youtube
教程“让我们构建GPT
”、Andrej Karpathy
的NanoGPT
项目、Brendan Bycroft
的transformers
的3D
可视化以及3Blue1Brown
的LLM
课程。