蔚来汽车AI算法面试重点，如何理解注意力？

本文链接：https://blog.csdn.net/xiaoganbuaiuk/article/details/141158373

今天分享一个上海蔚来汽车的AI算法岗位面试经验总结帖，面试岗位为算法工程师。

这次面试提到的问题，除了与实习相关内容和反问之外，面试官总共问了8个问题，主要集中在深****度学习基础概念的理解上，在聚焦一点讲是集中在自然语言处理相关的算法理解上。

看了这个面经贴，我突然想到帖子中到的很多知识点，我写的文章都提到过。

比如梯度消失和梯度爆炸的原因，这一点在介绍激活函数时曾经提到过，LSTM 的更新门的原理。

除了一些较简单的算法理解之外，面试中还重点问到了注意力机制的内容。

接下来，我将通过两个论文中的例子，来展示一下在AI模型中，注意力机制时如何帮助模型完成对于输入数据的注意的。

文本阅读任务是让AI完成文本的阅读，并且可以理解文本所表达的意思，在这篇论文中，作者使用自注意力机制来完成机器阅读的任务。

所谓自注意力（Self-Attention)的关键是：计算同一个序列中不同位置的注意力关系，自注意力在文本阅读/文本总结/图像描述等场景中非常有效。

下面的图像展示了模型在完成文本阅读过程中，处理每个单词时更加关注其他的哪些单词，以此来提取词与词之间的关系，从而更好地理解句子。

上图中，红色的词为模型当前正在识别的词，蓝色阴影的词表示此时模型更加关注的其他词，也就是说和红色的词更加有关联的词。

可以看到，当模型观察到 chasing 单词时，会注意到与 chasing 更加有关系的是 FBI 和 is.

这篇论文完成的是图像描述任务（输入一张图像，输出对于这张图像的描述语言）。

作者利用注意力机制来完成图像的信息捕捉。使用的仍然是典型的 Encoder-Decoder 架构。只不过因为输入数据是图像这种结构化的数据，因此，Encoder 采用的 CNN 来完成图像的特征提取，而 Decoder则采用了 LSTM 完成图像特征到描述文字的转换。

下图展示了在这个过程中，模型在输出每个描述单词时，其注意力更多地关注在图像中的哪些地方。

模型在看到上述的图像后，输出的描述为：A woman is throwing a frisbee in a park。可以看到，当输出 woman 的时候，模型更加关注图中的人物，而当输出 a frisbee(一个飞盘）时，模型更加关注图中的红色飞盘部分。

说明注意力机制在处理图像这种结构化的数据中也具有非常好的效果。

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以V扫描下方二维码免费领取🆓
在这里插入图片描述

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述