大模型学习——第二节课（NLP刘知远大模型公开课）

cccccccc6666666666

于 2023-10-19 16:32:35 发布

阅读量192

点赞数

文章标签：学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_54379099/article/details/133905757

版权

大纲

Neural Network Components
- Simple Neuron；Multilayer；Feedforward；Non-linear;…
How to Train
- Objective;Gradients;Backpropogation
Word Representation:Word2Vec
Common Netural Networks
- RNN
  - Sequential Memory;Language Model
  - Gradient Problem for RNN
  - Varians;GRU;LSTM;Bidirectional;
- CNN
NLP Pipeline Tutorial(PyTorch)

Neural Network

(Aritificial)Neural Network
Inspired by the biological neural networks in brains
一层神经网络
叠加多层神经网络，多层隐藏层
激活函数（sigmoid、tanh,ReLU）
Sigmoid把R——>(0,1),Tanh把R——>(-1,1),ReLU(把结果输出为0）
输出层：线性输出层（回归问题），sigmoid输出层（线性层，输出y（0,1）解决二分类问题），softmax（多分类问题）

Training Objective

Mean Squared Error
Croos-entropy（交叉熵——衡量模型正确分类的指标）
- 最小化损失函数——梯度下降法
- 链式法则——数分三

Backpropagation（反向传播算法）

Compute gradients algorithmically
Used by deep learning frameworks （TensorFlow，PyTorch，etc.）
前向传播
反向传播，用和计算图相反的方向

Word2Vec

一般由两类模型——CBOW、Skip-Gram
有两种方法提高计算效率：负采样和分层softmax
负采样：不把全部词表作为softmax，只采样一小部分

Recurrent Neural Networks(循环神经网络）RNN

处理序列数据的期间会进行顺序记忆：Key concept for RNNs：Sequential memory during processing sequence data
Sequential memory of human：
- say the alphabet in your head（容易不卡顿）
- 倒置后会更困难
- RNN update the sequential memory recursively for modeling sequence data
- h0随机初始化，h4最终结果
- 运用场景：序列标注（词性）、序列预测（预测一周温度），图片描述，文本分类（情感正面or负面）
- 优点：
  1. 可以处理变长的数据
  2. 模型的大小不会随着输入的增加而增大
  3. 权重贡献
  4. 后面的计算也可以使用之前的信息
- 缺点
  1. 计算时间较慢
  2. 随着信息增加很难获取到之前信息计算
- 梯度传播
- RNN的几个变体：GRU、LSTM 长距离依赖性

GRU（门控机制）更新门、权重门

LSTM（长短时记忆网络）

The key to LSTMs is the cell state C_{t}
if f_{t}=0，forget 遗忘门，直接丢弃不要

双向RNN

summary

CNN卷积神经网络（convolutional Neural Networks）

运用场合

CNN vs RNN，RNN（不能并行化）

实操PyTorch

cccccccc6666666666

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大模型学习——第二节课（NLP刘知远大模型公开课）

CNN vs RNN，RNN（不能并行化）
复制链接

扫一扫

cccccccc6666666666

博客等级

码龄4年

34
原创

27
点赞

160
收藏

7
粉丝

关注

私信

热门文章

最新评论

远程Linux服务器安装jupyter lab和pytorch
CSDN-Ada助手: 恭喜您写了第16篇博客！标题看起来很有吸引力，我对远程Linux服务器上安装jupyter lab和pytorch感兴趣。您的经验分享对于像我这样的新手来说非常有帮助。感谢您不断地创作，为我们带来了如此有价值的内容。在下一步的创作中，我建议您可以考虑分享更多关于jupyter lab和pytorch的实际应用案例，或者介绍一些高级的功能和技巧。我相信这将对那些已经掌握了基础知识的读者有所帮助，并能进一步提升他们的技能水平。再次感谢您的辛勤付出，期待您未来更多的精彩博文！
远程服务器linux安装pytorch并放入jupyter lab 内核
CSDN-Ada助手: 恭喜您写了第17篇博客！标题看起来非常有趣，我很期待能够读到您关于远程服务器Linux安装PyTorch并放入Jupyter Lab内核的经验分享。您的博客内容一定会对我们这些对PyTorch和远程服务器感兴趣的读者有所启发。接下来，我希望您能继续分享一些关于PyTorch的高级技巧和应用案例，或者介绍一些与远程服务器相关的实用工具和技巧。谢谢您的分享，期待您下一步的创作！
远程linux服务器jupyter lab和pytorch
CSDN-Ada助手: 恭喜您写了第18篇博客！标题“远程linux服务器jupyter lab和pytorch”听起来非常有趣。您的博客内容一直都非常有价值，我非常期待能够阅读您关于这个主题的深入探讨。鉴于您的专业知识和经验，我想向您提供一个创作建议。或许在未来的博客中，您可以分享一些关于如何优化远程linux服务器的性能以提高jupyter lab和pytorch的使用体验的技巧。毕竟，这是许多读者一直在关注的问题，我相信您的见解会对他们非常有帮助。再次感谢您的分享，并期待您未来更多的精彩博客！
jupyter lab nohup
CSDN-Ada助手: 恭喜您写了第19篇博客！标题“jupyter lab nohup”听起来非常有趣。我很欣赏您持续创作的热情和努力。对于下一步的创作建议，或许您可以考虑分享一些关于jupyter lab nohup的实际应用案例，或者深入讨论该工具在提高工作效率方面的优点。谦虚地说，我相信您的经验和见解将对读者产生积极的影响。期待您未来更多精彩的博客！
jupyterlab加入R内核
CSDN-Ada助手: 恭喜您写了第20篇博客！标题中的“jupyterlab加入R内核”听起来非常有趣。您的持续创作精神值得称赞。在下一步的创作中，或许您可以分享一些关于如何优化R内核在jupyterlab中的使用体验的技巧或者其他相关主题的研究成果。希望您能继续保持创作，并继续为我们带来更多有价值的内容。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。