第一二三节课:基础知识
- 第一节课:huggingface使用教程(地址 需要翻墙)
- 第二节课:Python基础教程(数据结构) 不做过多赘述
- 第三节课:Pytorch教程(numpy数据结构 以及 tensor计算)
第四节课:词向量
word2vec 的思路 从ont-hot 到 word2vec
以及词向量表示的训练方式 CBOW 与 skip-gram
(我理解为Tokenizer的的训练过程)
第五节课:神经分类器
skip-gram的负采样策略
Glove 和 SVD
一词多义问题(后续见得不多 这里不做过多了解)
第六节课:反向传播和神经网络
NER(命名实体识别)任务
反向传播(梯度回传)
第七节课:句法结构和依赖解析
依赖结构解析(句法树)
第八节课:递归神经网络
RNN神经网络(有点老,暂时不过多分析)
第九节课:简易的RNN和LSTM
LSTM介绍
第十节课:翻译,seq2seq,注意力机制
seq2seq(softmax去预测output beam search)
第十一节课:self-attention and Transfromer
transformer的各个部分讲解
第十二节课:预训练
Subword方法(BPE、WordPiece、ULM)
Encoder-Only、Encoder-Decoder、Decoder-Only
预训练(主要讲了bert的预训练方式mlm)和微调
第十三节课:强化学习
讲了思维链的思想
Zero-shot与Few-shot
Instruction tuning 源论文
RLHF 基于人类反馈的进行强化学习以及KL计算
第十四节课:自然语言生成
decode:top-k、top-p、temperature
exposure bias :scheduled sampling、dataset Aggregation、retrieval augmentation、reinforcement Learning
第十五节课:问答
BiDAF和Bert做问答(有点老)