- 博客(8)
- 问答 (1)
- 收藏
- 关注
原创 学习Transformer必看
这是一个搬运,发现了一篇关于学习transformer很好的教程:The Annotated Transformer
2024-07-21 19:56:16 180
原创 什么是ABC类(abstract base class)
这个ABC其实全称就是abstract base class,也叫做抽象基类。那么这个ABC有什么用呢?大家肯定经常在一些代码中看到下面这样一行东西。这样应该就清楚一些了。
2024-07-12 20:04:38 228
原创 sliding window attention
同时,这种方式并不是意味着当前token只能获取到前window_size个token的信息,因为当前token前面的window_size个token也都是能够获取到前面的信息的,因此只要网络达到一定的深度,这样的sliding window attention是可行的,并不会损失太多信息。sliding window attention是为了解决在输出序列长度sequence length很大的时候attention计算量爆炸增长的问题。
2024-07-03 18:16:30 1006 1
原创 Sequence to Sequence Learningwith Neural Networks论文阅读
简要概述阅读论文Sequence to Sequence Learning with Neural Networks
2024-03-29 17:05:44 654
原创 transformer库generate函数参数测试
第一篇文章想要记录一下自己在玩transformer库中模型"gpt2"进行生成文字过程中调整generate函数参数对生成的文字的影响。
2023-11-20 23:03:08 1181 1
空空如也
langchain的报错有点奇怪,如何解决?
2024-02-16
为什么pygame无法创建游戏窗口,直接就结束进程了
2022-04-29
TA创建的收藏夹 TA关注的收藏夹
TA关注的人