1、tokenizer原理与算法
-
tokenizer原理与算法:BPE,ByteBPE, wordpiece,unilm,sentence-piece
-
tokenizer训练:sentence-piece
https://blog.csdn.net/fj1024/article/details/139737169大语言模型之十 SentencePiece-CSDN博客
2、position encoding方案
https://zhuanlan.zhihu.com/p/654277808大模型中的位置编码ALiBi,RoPE的总结和实现_alibi位置编码-CSDN博客
3、注意力机制与transformer架构
典型的transformer架构
-
decoder-only
-
encoder-only
-
encoder-decoder