【吴恩达deeplearning.ai】Course 5 - 序列模型 - 第二周测验

why do not

已于 2022-04-04 12:03:36 修改

阅读量1.8k

点赞数

分类专栏：吴恩达深度学习文章标签：人工智能深度学习机器学习

于 2022-03-14 15:07:53 首次发布

本文链接：https://blog.csdn.net/qq_42994177/article/details/123319340

版权

吴恩达深度学习专栏收录该内容

83 篇文章 23 订阅

订阅专栏

1.假设你为10000个单词学习词嵌入，为了捕获全部范围的单词的变化以及意义，那么词嵌入向量应该是10000维的。

【】正确
【★】错误

2.什么是t-SNE？

【★】一种非线性降维算法。
【】一种能够解决词向量上的类比的线性变换。
【】一种用于学习词嵌入的监督学习算法。
【】一个开源序列模型库。

3.假设你下载了一个已经在一个很大的文本语料库上训练过的词嵌入的数据，然后你要用这个词嵌入来训练RNN并用于识别一段文字中的情感，判断这段文字的内容是否表达了“快乐”。
在这里插入图片描述
那么即使“欣喜若狂”这个词没有出现在你的小训练集中，你的RNN也会认为“我欣喜若狂”应该被贴上 $y = 1$ 的标签。
【★】正确
【】错误

4.对于词嵌入而言，下面哪一个（些）方程是成立的？

【★】 $e_{boy} - e_{girl} ≈ e_{brother} - e_{sister}$

【】 $e_{boy} - e_{girl} ≈ e_{sister} - e_{brother}$

【★】 $e_{boy} - e_{brother} ≈ e_{girl} - e_{sister}$

【】 $e_{boy} - e_{brother} ≈ e_{sister} - e_{girl}$

5.设 $E$ 为嵌入矩阵， $e_{1234}$ 对应的是词“1234”的独热向量，为了获得1234的词嵌入，为什么不直接在Python中使用代码 $E∗e_{1234}$ 呢？

【★】因为这个操作是在浪费计算资源。
【】因为正确的计算方式是 $E^T ∗ e_{1234}$ 。
【】因为它没有办法处理未知的单词（）。
【】以上全都不对，因为直接调用 $E∗e_{1234}$ 是最好的方案。

6.在学习词嵌入时，我们创建了一个预测 $\mid context)$ 的任务，如果这个预测做的不是很好那也是没有关系的，因为这个任务更重要的是学习了一组有用的嵌入词。

【★】正确
【】错误

7.在word2vec算法中，你要预测 $\mid c)$ ，其中 $t$ 是目标词（target word）， $c$ 是语境词（context word）。你应当在训练集中怎样选择 $t$ 与 $c$ 呢？

【★】 $c$ 与 $t$ 应当在附近词中。
【】 $c$ 是在 $t$ 前面的一个词。
【】 $c$ 是 $t$ 之前句子中所有单词的序列。
【】 $c$ 是 $t$ 之前句子中几个单词的序列。

8.假设你有1000个单词词汇，并且正在学习500维的词嵌入，word2vec模型使用下面的softmax函数：
$\mid c)=\frac{e^{\theta_t^Te_c}}{\sum_{t′=1}^{10000} e^{\theta_{t′}^T e_c}}$
以下说法中哪一个（些）是正确的？

【★】 $\theta_t$ 与 $e_c$ 都是500维的向量。
【】 $\theta_t$ 与 $e_c$ 都是10000维的向量。
【★】 $\theta_t$ 与 $e_c$ 都是通过Adam或梯度下降等优化算法进行训练的。
【】训练之后， $\theta_t$ 应该非常接近 $e_c$ ，因为 $t$ 和 $c$ 是一个词。

9.假设你有10000个单词词汇，并且正在学习500维的词嵌入，GloVe模型最小化了这个目标:
$\min \sum^{10,000}_{i=1}\sum^{10,000}_{j=1}f(X_{ij})(\theta^T_ie_j+b_i+b′_j−logX_{ij})^2$
以下说法中哪一个（些）是正确的？

【】 $\theta_i$ 与 $e_j$ 应当初始化为0。
【★】 $\theta_i$ 与 $e_j$ 应当使用随机数进行初始化。
【★】 $X_{ij}$ 是单词i在j中出现的次数。
【★】加权函数 $f (.)$ 必须满足 $f (0) = 0$ 。

The weighting function helps prevent learning only from extremely common word pairs. It is not necessary that it satisfies this function.
加权函数有助于防止仅从非常常见的单词对中学习，它不必满足这个函数。

10.你已经在文本数据集 $m_1$ 上训练了词嵌入，现在准备将它用于一个语言任务中，对于这个任务，你有一个单独标记的数据集 $m_2$ ，请记住，使用词嵌入是一种迁移学习的形式，在这种情况下，你认为词嵌入会有帮助吗？

【★】 $m_1\gt \gt m_2$

【】 $m_1 \lt \lt m_2$

why do not

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【吴恩达deeplearning.ai】Course 5 - 序列模型 - 第二周测验

假设你为10000个单词学习词嵌入，为了捕获全部范围的单词的变化以及意义，那么词嵌入向量应该是10000维的。【】正确【★】错误什么是t-SNE？【★】一种非线性降维算法。【】一种能够解决词向量上的类比的线性变换。【】一种用于学习词嵌入的监督学习算法。【】一个开源序列模型库。假设你下载了一个已经在一个很大的文本语料库上训练过的词嵌入的数据，然后你要用这个词嵌入来训练RNN并用于识别一段文字中的情感，判断这段文字的内容是否表达了“快乐”。x(输入文本) y (是否快乐)
复制链接

扫一扫

专栏目录