- 博客(3)
- 收藏
- 关注
原创 Transformer的简单实现:CS224n作业5代码解析
CS224n作业5的项目代码解析,实现了一个简单Transformer模型,基于维基百科数据预训练并在问答数据集上进行微调。
2024-06-18 17:56:52
1099
原创 带注意力的LSTM翻译模型:在数据流动和维度变化中分析原理和核心代码
从数据流动及维度变化的角度出发对模型进行解释,着重关注计算过程中张量维度的变化,简单介绍模型原理到代码实践之间的处理
2024-06-13 13:09:41
850
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人