1.13 总结-深度学习第五课《序列模型》-Stanford吴恩达教授

最新推荐文章于 2022-03-04 16:46:11 发布

Zhao-Jichao

最新推荐文章于 2022-03-04 16:46:11 发布

阅读量2.4k

点赞数 2

分类专栏：深度学习DL 文章标签：神经网络人工智能深度学习机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36815313/article/details/105849793

版权

深度学习DL 专栏收录该内容

206 篇文章 2796 订阅

订阅专栏

←上一篇	↓↑	下一篇→
1.12 深层循环神经网络	回到目录	1.13 总结

总结

习题

第 141 题

假设你的训练样本是句子(单词序列)，下面哪个选项指的是第i个训练样本中的第j个词?

A. $x^{(i)<j>}$

B. $x^{<i>(j)}$

C. $x^{(j)<i>}$

D. $x^{<j>(i)}$

第 142 题

看一下下面的这个循环神经网络：
在这里插入图片描述
在下面的条件中，满足上图中的网络结构的参数是：

A. $T_x=T_y$
B. $T_x<T_y$
C. $T_x>T_y$
D. $T_x=1$

第 143 题

这些任务中的哪一个会使用多对一的RNN体系结构？

在这里插入图片描述
A.语音识别（输入语音，输出文本）

B.情感分类（输入一段文字，输出0或1表示正面或者负面的情绪）

C.图像分类（输入一张图片，输出对应的标签）

D.人声性别识别（输入语音，输出说话人的性别）

第 144 题

假设你现在正在训练下面这个RNN的语言模型：
在这里插入图片描述
在 $t$ 时，这个RNN在做什么？

A.计算 $P(y^{<1>},y^{<2>},…,y^{<t-1>})$

B.计算 $P(y^{<t>})$

C.计算 $P(y^{<t>}∣y^{<1>},y^{<2>},…,y^{<t-1>})$

D.计算 $P(y^{<t>}∣y^{<1>},y^{<2>},…,y^{<t>})$

第 145 题

你已经完成了一个语言模型RNN的训练，并用它来对句子进行随机取样，如下图：
在这里插入图片描述
在每个时间步 $t$ 都在做什么？

A.(1)使用RNN输出的概率，选择该时间步的最高概率单词作为 $\hat{y}^{<t>}$ ，(2)然后将训练集中的正确的单词传递到下一个时间步

B.(1)使用由RNN输出的概率将该时间步的所选单词进行随机采样作为 $\hat{y}^{<t>}$ ，(2)然后将训练集中的实际单词传递到下一个时间步

C.(1)使用由RNN输出的概率来选择该时间步的最高概率词作为 $\hat{y}^{<t>}$ ，(2)然后将该选择的词传递给下一个时间步

D.(1)使用RNN该时间步输出的概率对单词随机抽样的结果作为 $\hat{y}^{<t>}$ ，(2)然后将此选定单词传递给下一个时间步

第 146 题

你正在训练一个RNN网络，你发现你的权重与激活值都是“NaN”，下列选项中，哪一个是导致这个问题的最有可能的原因？

A.梯度消失

B.梯度爆炸

C.ReLU函数作为激活函数g(.)，在计算g(z)时，z的数值过大了

D.Sigmoid函数作为激活函数g(.)，在计算g(z)时，z的数值过大了

第 147 题

假设你正在训练一个LSTM网络，你有一个10,000词的词汇表，并且使用一个激活值维度为100的LSTM块，在每一个时间步中， $\Gamma_u$ 的维度是多少？

A.1

B.100

C.300

D.10000

第 148 题

这里有一些GRU的更新方程：
在这里插入图片描述
爱丽丝建议通过移除 $\Gamma_u$ 来简化GRU，即设置 $\Gamma_u=1$ 。贝蒂提出通过移除 $\Gamma_r$ 来简化GRU，即设置 $\Gamma_r=1$ 。哪种模型更容易在梯度不消失问题的情况下训练，即使在很长的输入序列上也可以进行训练？

A.爱丽丝的模型（即移除 $\Gamma_u$ ），因为对于一个时间步而言，如果 $\Gamma_r\approx0$ ，梯度可以通过时间步反向传播而不会衰减。

B.爱丽丝的模型（即移除 $\Gamma_u$ ），因为对于一个时间步而言，如果 $\Gamma_r\approx1$ ，梯度可以通过时间步反向传播而不会衰减。

C.贝蒂的模型（即移除 $\Gamma_r$ ），因为对于一个时间步而言，如果 $\Gamma_u\approx0$ ，梯度可以通过时间步反向传播而不会衰减。

D.贝蒂的模型（即移除 $\Gamma_r$ ），因为对于一个时间步而言，如果 $\Gamma_u\approx1$ ，梯度可以通过时间步反向传播而不会衰减。

第 149 题

这里有一些GRU和LSTM的方程：
在这里插入图片描述
从这些我们可以看到，在LSTM中的更新门和遗忘门在GRU中扮演类似___与___的角色，空白处应该填什么？

A. $\Gamma_u$ 与 $1-\Gamma_u$
B. $\Gamma_u$ 与 $\Gamma_r$
C. $1-\Gamma_u$ 与 $\Gamma_u$
D. $\Gamma_r$ 与 $\Gamma_u$

第 150 题

你有一只宠物狗，它的心情很大程度上取决于当前和过去几天的天气。你已经收集了过去365天的天气数据 $x^{<1>},\cdots,x^{<365>}$ ，这些数据是一个序列，你还收集了你的狗心情的数据 $y^{<1>},\cdots,y^{<365>}$ ，你想建立一个模型来从x到y进行映射，你应该使用单向RNN还是双向RNN来解决这个问题？

A.双向RNN，因为在 $t$ 日的情绪预测中可以考虑到更多的信息。

B.双向RNN，因为这允许反向传播计算中有更精确的梯度。

C.单向RNN，因为 $y^{}的值仅依赖于x^{<1>},…,x^{}，而不依赖于x^{},…,x^{<365>}$

D.单向RNN，因为 $y^{}的值只取决于x^{}$ ，而不是其他天的天气。

141-150题答案

141.A 142.A 143.BD 144.C 145.D 146.B 147.B 148.C 149.A 150.C

←上一篇	↓↑	下一篇→
1.12 深层循环神经网络	回到目录	1.13 总结

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
1.13 总结-深度学习第五课《序列模型》-Stanford吴恩达教授

总结习题第 141 题假设你的训练样本是句子(单词序列)，下面哪个选项指的是第i个训练样本中的第j个词?A.x(i)x^{(i)}x(i)B.x(j)x^{(j)}x(j)C.x(j)x^{(j)}x(j)D.x(i)x^{(i)}x(i)第 142 题看一下下面的这个循环神经网络：在下面的条件中，满足上图中的网络结构的参数是：A. B.TxTyTx=1T_xT_yT_x=...
复制链接

扫一扫

专栏目录

Zhao-Jichao CSDN认证博客专家 CSDN认证企业博客

码龄8年

1135: 原创

1万+: 周排名

130万+: 总排名

319万+: 访问

: 等级

2万+: 积分

5379: 粉丝

3568: 获赞

1132: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

多智能体机器人系统控制及其应用付费 46篇
读书笔记 14篇
UGV 15篇
Visual Studio 24篇
Bioengineering 58篇
English 6篇
跨越时间的信
C++ 13篇
UAV 9篇
PaperAnalysis 10篇
RL 5篇
Paper 146篇
STM32 31篇
CoppeliaSim 5篇
书籍目录 16篇
控制 173篇
数理知识 68篇
Simulink/Matlab 49篇
Matlab 图像处理 13篇
专业学习 5篇
LaTeX 17篇
PyTorch 24篇
深度学习DL 206篇
机器学习ML 98篇
Python 29篇
Linux 2篇
Altium Designer 2篇
Arduino 47篇
Git 1篇
源码编辑器 1篇

最新评论

【UAV】串级 PID 控制原理及应用
天启而凡: 这种控制方式能让电机定速运行吗，在这个控制里面没有用到速度设定值，那怎么保证按设定的速度运行的？我想让电机定速运行到指定位置，怎么实现呢
【Python】在 jetson 平台上，使用 python 处理串口设备
a_789_: import serial import time # 配置串口参数 serial_port = '/dev/ttyUSB0' # 替换为实际的串口设备 baud_rate = 9600 # 根据传感器的波特率进行设置 timeout = 1 # 超时时间 # 初始化串口 ser = serial.Serial(serial_port, baud_rate, timeout=timeout) try: while True: if ser.in_waiting: # 读取数据 data = ser.readline().decode('utf-8').strip() print(f"Received data: {data}") time.sleep(0.1) except KeyboardInterrupt: print("Program interrupted by user") finally: ser.close() print("Serial port closed")
【Python】在 jetson 平台上，使用 python 处理串口设备
a_789_: dmesg | grep tty [ 0.000000] Kernel command line: root=/dev/mmcblk0p1 rw rootwait rootfstype=ext4 mminit_loglevel=4 console=ttyTCU0,115200 console=tty0 firmware_class.path=/etc/firmware fbcon=map:0 net.ifnames=0 [ 0.000795] printk: console [tty0] enabled [ 0.393612] printk: console [ttyTCU0] enabled [ 5.943414] 3100000.serial: ttyTHS0 at MMIO 0x3100000 (irq = 13, base_baud = 0) is a TEGRA_UART [ 5.953106] 3130000.serial: ttyTHS3 at MMIO 0x3130000 (irq = 64, base_baud = 0) is a TEGRA_UART [ 9.750429] systemd[1]: Created slice system-serial\x2dgetty.slice. [ 2167.155104] usb 1-4.4: ch341-uart converter now attached to ttyUSB0 [ 2262.445959] ch341-uart ttyUSB0: ch341-uart converter now disconnected from ttyUSB0
4.6 前向和反向传播-深度学习-Stanford吴恩达教授
blueskyliulan: 反向传播的时候da[l]怎么来的呢
【控制】拉普拉斯拉氏变换原理分解理解
weixin_48642592: 老铁，都2924年了，补的图呢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Zhao-Jichao 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。