BERT、激活函数等面试题

Xu_Wave

已于 2022-04-18 00:18:10 修改

阅读量1k

点赞数 2

分类专栏： NLP(包含深度学习) 文章标签：自然语言处理

于 2020-05-18 10:59:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22795223/article/details/106184310

版权

NLP(包含深度学习) 专栏收录该内容

55 篇文章 36 订阅

订阅专栏

1、神经网络中的激活函数：对比ReLU与Sigmoid、Tanh的优缺点？ReLU有哪些变种？

ReLU
优点：

从计算的角度上，Sigmoid和Tanh激活函数均需要计算指数，复杂度高，而ReLU输入一个数值即可得到激活值；
ReLU函数被认为有生物上的解释性，比如单侧抑制、宽兴奋边界（即兴奋程度也可以非常高）人脑中在同一时刻大概只有1 ∼ 4%的神经元处于活跃状态，所以单侧抑制提供了网络的稀疏表达能力，宽激活边界则能有效解决梯度消失等问题。==

缺点：

ReLU和Sigmoid一样，每次输出都会给后一层的神经网络引入偏置偏移，会影响梯度下降的效率。
ReLU神经元死亡的问题，不正常的一次参数更新，可能是使得激活项为0，以后的梯度更新也为0，神经元死亡。

变种其实都是在负边界上进行不同的微调，具体名字不太记得了。

2、前馈神经网络叫做多层感知机是否合适？

感知机其实就是对数据进行超平面的划分，那么前提是数据是线性可分的，
但前馈神经网络可想而知，并没有这个前提，所以并不合适。

3、RNN中为什么要采用tanh而不是ReLU作为激活函数？为什么普通的前馈网络或 CNN 中采取ReLU不会出现问题？

先明确第一个问题，RNN可以使用Tanh也可以使用Relu！
RNN反向传播中连乘的一个公式一般是对sigmoid函数的求导，然后与一个权重矩阵相乘。
那么如果使用ReLU作为激活函数，那么必须保证权重矩阵是从单位矩阵开始进行初始化的，如果是以这样一种方式进行RNN，已经有实验证明这也是一个可以提升模型效果的一个trick。但是如果权重矩阵不是单位矩阵，则会出现梯度爆炸/消失的问题。

第二个问题其实是和RNN与普通神经网络结构有关，RNN的参数矩阵是共享的，所以梯度更新会存在一个连乘的操作（前向传播ht依赖ht-1，反向传播则会存在连乘项）；而普通神经网络的参数矩阵不同层是独立同分布的，在更新时，其实是存在一个互相抵消的过程，即使是多层，也不会出现问题。

4、elmo、GPT、bert三者之间有什么区别？

在这里插入图片描述

5、Bert与GPT-2的对比

相同点：

Bert和GPT-2都采用的是transformer作为底层结构
效果都好

不同点：
在这里插入图片描述

6、为什么 BERT 比 ELMo 效果好？

在这里插入图片描述

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
1
评论
BERT、激活函数等面试题

面试题
复制链接

扫一扫

专栏目录

Xu_Wave CSDN认证博客专家 CSDN认证企业博客

码龄10年

自然语言处理领域新星创作者

113: 原创

8360: 周排名

62万+: 总排名

18万+: 访问

: 等级

3001: 积分

1万+: 粉丝

306: 获赞

62: 评论

1025: 收藏

私信

关注

热门文章

分类专栏

最新评论

Word2Vec原理解析二：层级Softmax与负采样
林北林奈: 似然函数L那里是不是多了对w∈C的求和？因为我们只要让目标词汇所在路径的概率最大，其他的都不考虑啊，显然不应该将所有路径都算入
Word2Vec原理解析一
CSDN-Ada助手: pytorch 的优势是什么？
Transformer-XL详解
weixin_45405814: 请问为何需要 u 和 v 两个向量，而不是用一个就可以了
GloVe最全面、最深度的解析
m0_60066487: 是我看过的中解释最清楚的，赞！
GPT-2及与GPT的对比
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)使用更多的站内链接；(3)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Xu_Wave 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。