CS224n自然语言处理算法笔记目录

Sheldor369

已于 2024-06-21 17:48:21 修改

阅读量335

点赞数 11

分类专栏：算法笔记（CS224n）文章标签：自然语言处理算法笔记

于 2024-06-18 17:58:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43131525/article/details/139779988

版权

算法笔记（CS224n）专栏收录该内容

4 篇文章 0 订阅

订阅专栏

第一二三节课：基础知识

第一节课：huggingface使用教程（地址需要翻墙）
第二节课：Python基础教程（数据结构）不做过多赘述
第三节课：Pytorch教程（numpy数据结构以及 tensor计算）

第四节课：词向量

word2vec 的思路从ont-hot 到 word2vec
以及词向量表示的训练方式 CBOW 与 skip-gram
（我理解为Tokenizer的的训练过程）

第五节课：神经分类器

skip-gram的负采样策略
Glove 和 SVD
一词多义问题（后续见得不多这里不做过多了解）

第六节课：反向传播和神经网络

NER（命名实体识别）任务
反向传播（梯度回传）

第七节课：句法结构和依赖解析

依赖结构解析（句法树）

第八节课：递归神经网络

RNN神经网络（有点老，暂时不过多分析）

第九节课：简易的RNN和LSTM

LSTM介绍

第十节课：翻译，seq2seq，注意力机制

seq2seq（softmax去预测output beam search）

第十一节课：self-attention and Transfromer

transformer的各个部分讲解

第十二节课：预训练

Subword方法（BPE、WordPiece、ULM）
Encoder-Only、Encoder-Decoder、Decoder-Only
预训练（主要讲了bert的预训练方式mlm）和微调

第十三节课：强化学习

讲了思维链的思想
Zero-shot与Few-shot
Instruction tuning 源论文
 RLHF 基于人类反馈的进行强化学习以及KL计算

第十四节课：自然语言生成

decode：top-k、top-p、temperature
exposure bias ：scheduled sampling、dataset Aggregation、retrieval augmentation、reinforcement Learning

第十五节课：问答

BiDAF和Bert做问答（有点老）

关注

11
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
CS224n自然语言处理算法笔记目录

seq2seq（softmax去预测output beam search）以及词向量表示的训练 CBOW skip-gram。的思路从ont-hot 到 word2vec。一词多义问题（后续见得不多这里不做过多了解）（我理解为Tokenizer的的训练过程）RNN神经网络（有点老，暂时不详细了解）NER（命名实体识别）任务。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。