NLP复习2020（1）

最新推荐文章于 2023-10-22 20:51:53 发布

qq_34117199

最新推荐文章于 2023-10-22 20:51:53 发布

阅读量887

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34117199/article/details/106893028

版权

NLP复习2020（1）

1.判断题
- 1.神经网络预训练时可以将所有参数全部初始化为0。
- 2.从计算角度上，Sigmoid和tanh激活函数均需要计算指数，复杂度高，而ReLU只需要一个阈值即可得到激活值。
2.选择题
3.填空题
4. 分析题
重要概念：

1.判断题

1.神经网络预训练时可以将所有参数全部初始化为0。

答：不能，会造成训练时无法更新梯度，使训练无法收敛。见：https://zhuanlan.zhihu.com/p/27190255

2.从计算角度上，Sigmoid和tanh激活函数均需要计算指数，复杂度高，而ReLU只需要一个阈值即可得到激活值。

答：正确。相关知识见：激活函数—Sigmoid、Tanh、ReLu、softplus、softmax

2.选择题

下面哪些方法有助于解决深度网络的梯度消失问题（ACD）

控制网络深度
使用Sigmoid激活函数
预训练+微调
使用ReLU激活函数
见详解深度学习中的梯度消失、爆炸原因及其解决方法

3.填空题

从给定的句子可以产生___9__个二元组短语（Bigram）：
「Analytics Vidhya is a great source to learn data science」
二元组短语: Analytics Vidhya, Vidhya is, is a, a great, great source, source to, To learn, learn data, data science

4. 分析题

“结婚的和尚未结婚的”会被分词为 “结婚的和尚未结婚的“的原因是？
见中文分词概述和规则分词

重要概念：

重要概念：激活函数：
sigmod和tanh，相同点：
优点：平滑
优点：易于求导
缺点：幂运算相对耗时
缺点：导数值小于 1，反向传播易导致梯度消失（Gradient Vanishing）
sigmod：
优点：可以作为概率，辅助模型解释
缺点：输出值不以零为中心，可能导致模型收敛速度慢

ReLU：
但是它比较好地解决了梯度消失的问题，而且计算速度非常快，只需要判断输入是否大于0，收敛速度远快于sigmoid和tanh。它是比较常用的激活函数。

但是，relu函数也有问题，训练的时候很”脆弱”。例如，一个非常大的梯度流过一个 ReLU 神经元，更新过参数之后，这个神经元再也不会对任何数据有激活现象了，那么这个神经元的梯度就永远都会是 0。如果 learning rate 很大，那么很有可能网络中的 40% 的神经元都”dead”了。
神经网络基础；

梯度消失：详解深度学习中的梯度消失、爆炸原因及其解决方法；
skip-gram和cbow：词向量；
RNN，lstm：循环神经网络；
seq2seq：attention, self-attention： seq2seq；
transformer： transformer
多义词；：从EMLo到Bert
mask：从EMLo到Bert

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
9
评论
NLP复习2020（1）

NLP复习2020（1）1.判断题1.神经网络预训练时可以将所有参数全部初始化为0。2.从计算角度上，Sigmoid和tanh激活函数均需要计算指数，复杂度高，而ReLU只需要一个阈值即可得到激活值。2.选择题3.填空题4. 分析题1.判断题1.神经网络预训练时可以将所有参数全部初始化为0。答：不能，会造成训练时无法更新梯度，使训练无法收敛。见：https://zhuanlan.zhihu.com/p/271902552.从计算角度上，Sigmoid和tanh激活函数均需要计算指数，复杂度高，而Re
复制链接

扫一扫

qq_34117199 CSDN认证博客专家 CSDN认证企业博客

码龄8年

3: 原创

111万+: 周排名

46万+: 总排名

6616: 访问

: 等级

119: 积分

6: 粉丝

6: 获赞

13: 评论

60: 收藏

私信

关注

热门文章

最新评论

无人机slam定位算法调研
HE199006: 您好假设好的计算芯片定位精度大概多少呢
在docker中使用ROS-melodic加rviz
qq_34117199: 这个没试过，不太清楚
在docker中使用ROS-melodic加rviz
左心261: 可以用这个监视子网ip嘛
在docker中使用ROS-melodic加rviz
Marionette_hua: xie de tai hao le
NLP复习2020（1）
qq_34117199: 还行，我们那会儿考的不太难，一般会有一点比较难点的题，但是大多都不难

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。